伦敦布鲁内尔大学和莱斯特大学的研究人员开发了一种算法,可以分析用户在推特上发布的抑郁迹象。他接受了一个数据库的培训,该数据库包含数千名Twitter用户的历史以及有关他们心理健康的信息。少于5条推文的账户被排除在培训和最终测试之外。
在工作开始时,机器人开始扫描错误和缩写。在他们的搜索和解码之后,开始分析帖子。该程序考虑了38个不同的因素,包括推文的数量、关键字的使用频率、朋友的数量、表情符号的使用频率、转发的数量、提及、文本的语言特征、出版时间等等。收集到的数据库中80%用于训练机器人,剩下的20%用于测试。
研究人员声称,使用他们自己的清华推特抑郁症数据集,他们在识别抑郁症迹象方面能够达到88.39%的准确率。
作者的研究无法免费查看,但该材料的预印本已保存在arXiv上。以下是预印本中介绍的程序方案。第一步以红色突出显示。在其中,程序执行数据处理并提取Twitter用户的关键特征。第二步,Cost-sensitiveBoostingPruningTrees(CBPT)工具根据用户发现的特征对用户进行分类。分类算法本身建立在AdaBoost之上。
据作者介绍,该工具可用于分析几乎任何社交平台的用户。他们建议使用它不仅可以检测个人用户抑郁的早期迹象,还可以进行调查、分析大众情绪等。
下一步是研究机器人在各种条件下的有效性。此外,开发的分类技术可以集成到电子商务、面试或寻找候选人等领域的应用中。该工具可能有助于雇主根据他在社交网络上的信息对他的状况进行初步分析。