火星科技网您的位置:首页 >人工智能 >

使用机器学习预测高影响力研究

导读 麻省理工学院研究人员建立的人工智能框架可以通过学习以前的科学出版物的模式,为未来的高影响力技术提供预警信号。通过对其功能的回顾性测

麻省理工学院研究人员建立的人工智能框架可以通过学习以前的科学出版物的模式,为未来的高影响力技术提供“预警”信号。通过对其功能的回顾性测试,DELPHI是“通过学习预测高影响力来进行动态早期预警”的缩写,它能够在专家的主要精液生物技术清单上识别出所有开创性论文,有时甚至早于其发表后的第一年。

麻省理工学院媒体实验室的研究机构James W. Weis和媒体艺术与科学教授,媒体实验室的Molecular Machines研究小组负责人约瑟夫雅各布森(Joseph Jacobson)也利用DELPHI突出显示了他们预测将要发表的50篇最新科学论文。到2023年产生巨大影响。这些论文涵盖的主题包括用于癌症治疗的DNA纳米机器人,高能量密度锂氧电池以及使用深度神经网络的化学合成等。

研究人员将DELPHI视为一种工具,可以帮助人类更好地利用科研经费,确定可能会枯竭的“粗糙的钻石”技术,并为政府,慈善事业和风险投资公司提供一种更有效和高效地支持科学的途径。

“从本质上讲,我们的算法通过从科学史中学习模式,然后在新出版物上进行模式匹配来发现具有重大影响的早期信号而起作用,” Weis说。“通过追踪思想的早期传播,我们可以预测它们以有意义的方式传播或传播到更广泛的学术界的可能性。”

该论文已发表在《自然生物技术》上。

搜索“粗糙的钻石”

Weis和Jacobson开发的机器学习算法利用了自从1980年代以来科学出版物呈指数增长的大量数字信息。但是,DELPHI并不是使用诸如引用次数之类的一维方法来判断出版物的影响,而是接受了期刊文章元数据的完整时间序列网络的培训,以揭示其在整个科学生态系统中的高维分布。

结果是一个知识图,其中包含代表论文,作者,机构和其他类型数据的节点之间的连接。这些节点之间的复杂连接的强度和类型决定了它们的属性,这些属性在框架中使用。“这些节点和边定义了一个基于时间的图形,DELPHI可以使用它来学习预测未来可能会产生巨大影响的模式,” Weis解释说。

这些网络功能一起用于预测科学影响,在发表论文被认为是DELPHI旨在确定的“具有高度影响力”的目标集后五年,落入时间标度节点中心位置的前5%的论文。前5%的论文占图表总影响力的35%。这组作者说,DELPHI还可以使用时间缩放的节点中心的前1%,10%和15%的截止值。

DELPHI建议,影响力很大的论文几乎在其学科和较小的科学界以外传播。两篇论文可以被引用的次数相同,但影响力很大的论文可以吸引到越来越多的读者。另一方面,低影响力论文“并没有被越来越多的人真正利用和利用,” Weis说。

他补充说,该框架在“激励人们甚至彼此不认识的团队合作方面可能很有用,也许是通过向他们提供资金来共同解决重要的多学科问题”。

与仅引文数量相比,DELPHI识别出具有高度影响力的论文的数量是两倍以上,包括60%的“隐藏的宝石”或引文阈值可能遗漏的论文。

雅各布森说:“进行基础研究的目的是要有很多目标,然后能够迅速将最好的那些想法加倍。” “这项研究旨在了解我们是否可以通过使用整个学术界(嵌入在学术图谱中)以及在确定高影响力的研究方向时更具包容性来以更大规模的方式进行该过程。”

研究人员对于使用DELPHI在某些情况下出现高影响力纸张的“警报信号”出现的早期感到惊讶。Weis说:“在发布的一年内,我们已经确定了隐藏的宝石,这些宝石将在以后产生重大影响。”

但是他警告说,DELPHI并不能完全预测未来。“我们正在使用机器学习来提取和量化隐藏在已经存在的数据的维度和动态中的信号。”

公平,高效,有效的资金

研究人员说,希望是DELPHI将提供一种偏向更少的方式来评估论文的影响,正如过去的研究表明的那样,可以操纵诸如引用和期刊影响因子数之类的其他指标。

韦斯说:“我们希望我们可以利用它找到最值得的研究人员,无论他们隶属于哪个机构或它们之间有多紧密联系。”

他补充说,与所有机器学习框架一样,设计人员和用户应警惕偏见。“我们需要不断意识到数据和模型中的潜在偏差。我们希望DELPHI能够以较少偏见的方式帮助找到最佳研究成果-因此我们需要注意,我们的模型不能学会仅预测对模型的未来影响次优指标(例如h-Index,作者引文计数或机构隶属关系)的基础。”

DELPHI可能是一个强大的工具,可以帮助科学基金变得更加高效和有效,并且可以用来创建与科学投资有关的新型金融产品。

实验基金会执行理事戴维·朗(David Lang)说:“新兴的科学资金超科学表明,需要对科学投资采取投资组合的方法。” “魏斯和雅各布森为这种理解做出了重大贡献,更重要的是,它在DELPHI的实施中做出了贡献。”

韦斯在为生物技术初创公司启动风险投资基金和实验室孵化设施方面的经验很丰富,这是他思考过的很多事情。

他说:“我越来越意识到,包括我自己在内的投资者一直在相同的地点,以相同的观念来寻找新公司。” “我开始瞥见一大堆高才能的人才和惊人的技术,但这常常被人们忽略。我认为必须在此领域开展工作,而机器学习可以帮助我们找到并更有效地实现所有这些未开发的潜力。”

标签:

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。