火星科技网您的位置:首页 >人工智能 >

假新闻检测器算法比人类算法更好

导读 一种基于算法的系统,可以识别虚假新闻故事中的口头语言线索,从而为新闻聚合者和Google新闻之类的社交媒体网站提供反击错误信息的新武器。

一种基于算法的系统,可以识别虚假新闻故事中的口头语言线索,从而为新闻聚合者和Google新闻之类的社交媒体网站提供反击错误信息的新武器。开发该系统的密歇根大学研究人员证明,在正确识别假新闻故事方面,该系统可与人类媲美,有时甚至优于人类。

在最近的一项研究中,它成功地发现假冒的可能性高达76%,而人类的成功率是70%。此外,他们的语言分析方法可用于通过将其事实与其他故事进行交叉引用来识别太新而不能被揭穿的虚假新闻文章。

该项目背后的UM计算机科学与工程学教授Rada Mihalcea表示,对于正在努力处理大量假新闻故事的网站,自动化解决方案可能是一个重要工具,这些假新闻经常是为了产生点击次数或操纵舆论而创建的。

在假新闻产生真实后果之前捕捉假新闻可能很困难,因为当今的聚合器和社交媒体网站严重依赖于人类编辑,他们往往无法跟上新闻潮。此外,当前的揭穿技术通常取决于对事实的外部验证,而对于最新的报道则很难做到这一点。通常,当一个故事被证明是假的时,损害就已经造成了。

语言分析采用不同的方法,分析可量化的属性,例如语法结构,单词选择,标点符号和复杂性。它的工作速度比人类快,并且可以与各种不同的新闻类型一起使用。

“您可以想象在新闻或社交媒体网站的前端或后端可以有许多应用程序,” Mihalcea说。“它可以为用户提供对单个故事或整个新闻站点的可信度的估计。或者它可能是新闻站点后端的第一道防线,标记可疑的故事以供进一步审核。76%的成功率留下了相当大的误差,但是当它与人类并用时,仍然可以提供有价值的见解。”

Mihalcea说,分析书面语音的语言算法在今天非常普遍。构建假新闻检测器的挑战不在于构建算法本身,而是在于找到用于训练该算法的正确数据。

虚假新闻会很快出现并消失,因此很难收集。它也以多种形式出现,使收集过程更加复杂。例如,讽刺新闻很容易收集,但是讽刺和荒谬的用法使它对于训练算法以检测意图误导的虚假新闻的用处不大。

最终,Mihalcea的团队创建了自己的数据,将在线团队众包化,该团队将经过验证的真实新闻故事反向工程为伪造品。Mihalcea说,这就是大多数人创建真实的伪造新闻的方式,这些人迅速撰写这些伪造新闻以换取金钱报酬。

在Amazon Mechanical Turk的帮助下招募的研究参与者获得报酬,将简短的实际新闻报道转变为相似但伪造的新闻报道,以模仿文章的新闻风格。在流程结束时,研究团队拥有了500个真实和虚假新闻故事的数据集。

然后,他们将这些标记的故事对喂给执行语言分析的算法,教自己区分真实和虚假新闻。最终,该团队将算法转换为直接从网络提取的真实和虚假新闻的数据集,获得了76%的成功率。

新系统的详细信息以及该团队用于构建该系统的数据集是免费提供的,Mihalcea表示,新闻网站或其他实体可以使用它们来构建自己的虚假新闻检测系统。她说,可以通过合并元数据(例如与给定的在线新闻项目相关的链接和评论)来进一步完善未来的系统。

详细介绍系统的论文将在第27届国际计算语言学会议上发表,NM Mihalcea与UM计算机科学和工程学助理研究员Veronica Perez-Rosas,阿姆斯特丹大学心理学研究员Bennett Kleinberg以及UM本科生一起工作亚历山德拉(Alexandra Lefevre)。

标签:

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。