研究表明找到自动识别假新闻的方法可能比预期的要复杂
一组研究人员表示,点击诱饵标题对读者的吸引力可能没有人们想象的那么大。他们补充说,人工智能(AI)在正确确定标题是否为点击诱饵方面也可能不足。
在一系列研究中,研究人员发现,点击诱饵——通常依靠语言噱头来诱使读者进一步阅读的标题——通常表现不佳,在某些情况下,表现不如传统标题。
由于假新闻是社交媒体上的一个问题,研究人员已经探索使用 AI 来系统地识别和阻止点击诱饵。然而,研究还表明,用人工智能识别假新闻可能比预期的更复杂,唐纳德·P·贝利萨里奥传播学院媒体效果教授、该研究的联合主任 S. Shyam Sundar 说。媒体效果研究实验室。
“假新闻研究的一个想法是,如果我们能解决点击诱饵问题,我们就可以更接近解决假新闻问题,”桑达尔说,他也是宾夕法尼亚州立大学计算和数据科学研究所的附属机构。 ICDS)。“我们的研究稍微反驳了这一点。他们认为假新闻可能是一个完全不同的球赛,而且点击诱饵本身比我们想象的要复杂。”
在第一项研究中,研究团队随机分配 150 名参与者阅读八种不同类型的标题中的一种,并衡量参与者是否会阅读或分享故事。参与者要么阅读传统标题,要么阅读依赖于七种点击诱饵功能之一的标题,包括带有问题的标题、列表、“Wh”词(即,什么、何时)、指示性形容词(即,这、那)、正最高级(即最好、最大)、负最高级(即最差、最少)或模态(即可能、应该)。头条新闻取自可靠和不可靠的在线资源,并使用为检测点击诱饵而开发的算法进行分类。
“我们最初的问题之一是,哪些点击诱饵功能会吸引更多点击?” 该研究的主要作者、密歇根州立大学广告和公共关系助理教授玛丽亚·莫利纳 (Maria Molina) 说。“我们想更深入地探索这一点,但当我们分析结果时,我们意识到没有显着差异,而且,如果有的话,人们更容易被非点击诱饵标题所吸引。因此,从那里,我们认为可能有这可能发生的一些原因。”
Molina 表示,研究人员进行了第二项研究,以确保其他因素(例如每个标题的主题)不会混淆结果。
在这项研究中,研究人员招募了 249 名参与者,他们被随机分配到八个条件之一——七个点击诱饵标题和一个非点击诱饵标题。这一次,所有头条新闻都集中在一个政治话题上,并且是由一位前记者撰写的。该团队再次报告说,clickbait 标题并没有显着优于传统标题。
根据宾夕法尼亚州立大学信息科学与技术教授 Dongwon Lee 的说法,该团队进行了第三项研究,以检查研究中使用的几种类型的人工智能或机器学习模型,将标题分类为点击诱饵标题与否。他们发现模型经常对标题是否是点击诱饵产生分歧。
研究发现,四种 AI 模型仅在 47% 的时间内同意点击诱饵的分类。在被四种算法归类为相似的 175 个标题中,139 个被识别为点击诱饵,36 个被识别为非点击诱饵。系统之间的一致程度也因标题的类型而异。例如,虽然四种算法在针对负面最高级特征的点击诱饵分类上达成更多一致,但与其他六个特征相比,四个分类器未能就负面最高级或问题特征的非点击诱饵分类达成一致。
人工智能和机器学习模型的性能往往会有所不同,李说,他是 ICDS 的附属机构。当根据点击次数评估每个模型分类的标题时,四个模型中的三个一致表明,指示性形容词、列表和“wh”词比非点击诱饵标题吸引了更多的读者参与。
“由于这些机器学习模型是过去几十年的产物,我们有很多变化——有些非常简单,有些运行得非常快,而有些则更复杂,需要大量资源,”Lee 说。“这就像组装桌子一样——你可以用 5 美元的螺丝刀完成这项工作,但用 50 美元的电钻可能可以更快地完成这项工作。因此,根据这些机器学习模型的内在能力,以及给定模型的训练数据集,它们往往具有不同的性能水平和不同的优缺点。”
然而,这些发现引发了人们对使用人工智能仅通过对标题进行分类来检测假新闻的怀疑。
“人们投入大量资金使用点击诱饵标题作为虚假新闻检测算法的一个元素,但我们的研究对这一假设提出了质疑,”桑达尔说。
他补充说,这些研究还表明,开发算法来检测假新闻的程序员可能必须不断适应,因为人类假新闻制作者——以及媒体消费者——对构成假新闻的元素越来越了解。
“这有点像猫捉老鼠的游戏,”桑达尔说。“写假新闻的人可能会意识到被检测器识别为假新闻的特征,他们会改变策略。如果新闻消费者一直看到这些标题,他们也可能对某些特征变得麻木。所以,假新闻检测必须随着读者和创作者不断发展。”
研究人员认为,过去点击诱饵标题的流行可能是标题未能吸引读者参与研究的一个原因。Clickbait 在当今的媒体中可能无处不在,以至于它们无法像传统头条新闻一样脱颖而出并吸引同样的关注。
Molina 补充说,clickbait 的流行也带来了更多的媒体审查,这可能使研究参与者对 clickbait 标题更加谨慎。
标签: 自动识别假新闻的方法