AI使用推文帮助研究人员分析洪水
社交媒体受到很多负面新闻,但Twitter和Facebook比僵尸网络,模因和政治巨魔更多。在Arxiv.org的研究论文预印本中(“将社交媒体融入泛欧洪水意识系统:多种语言方法”),联合研究中心的科学家,欧洲委员会的科学和知识服务,详细介绍了原型 - 社交媒体洪水风险(SMFR) - 通过Twitter用户的实时报告“丰富”欧洲洪水意识系统(EFAS)。
它建立在哈佛大学和谷歌于2018年8月发表的研究基础之上,该研究描述了能够预测大地震后一年内余震位置的人工智能模型,以及12月份Facebook AI研究人员开发的一种分析卫星图像的方法。并量化火灾和其他灾害造成的损害。最近,谷歌的科学家发表了一篇关于机器学习系统的回顾展,该系统准确地预测了河流洪水 - 即来自超限河岸的洪水 - 精度达到75%。
另外,英国的研究人员使用推特机器学习算法来确定骚乱期间可能发生暴力的地方,大规模抗议活动即将来临时的预测,以及识别帮派成员。
“在过去的十年中,社交媒体已成为灾难期间的相关信息来源,促使来自不同领域的研究人员聚集在这一领域,”该论文的共同作者写道。“社交媒体分析已经证明有可能提供关于危机的时空发展的及时,宝贵的信息,并支持确定关键的灾害相关事件。”
首先,关于EFAS的快速入门:它是哥白尼应急管理服务(Copernicus EMS)的一部分,由欧洲委员会的紧急响应协调中心(ERCC)运营,该中心是欧盟委员会民事保护和人道主义援助行动的一个部门。支持对欧洲内外灾害的协调应对。与美国联邦紧急事务管理局非常相似,ERCC监控灾害和风险,收集和分析灾害数据,并为团队和设备部署准备计划。ERCC将EFAS用于预测 - 主要是概率性中程洪水预报(包括短程山洪),还包括季节预报,影响评估和早期预警。
研究人员的系统利用EFAS确定某个地理区域的洪水风险何时超过阈值。这触发了社交媒体 - Twitter上的数据收集 - 一次最多400个关键词,公共流媒体API的最大限制。
鉴于EFAS覆盖了人口超过27种语言的区域,提取具有相关关键词的消息(即表示即将发生或最近发生洪水的词语)并非易事。该团队的解决方案是一个多语言分类系统,它使用与语言无关的单词或单词嵌入的数学表示来推断四种语言中关键词的相似性:德语,英语,西班牙语和法语。
为了训练它,他们采购了包含7,000多条带注释消息的语料库(每种语言有1,200到2,300条消息)。与此同时,他们使用一个单独的模型来预测已经预测洪水风险的地区的“代表性”信息(至少有90%的洪水相关概率的推文)。
为了测试他们的方法的稳健性,科学家们将SMFR整合到EFAS并在2018年10月初影响意大利卡拉布里亚的最近洪水期间进行了部署.SMFR收集了两天的推文 - 总共约14,347 - SMFR分析了“相关性” “研究人员报告说,人工智能过滤的信息与实际洪水密切相关,他们说这是一个有希望迈向系统的第一步,可以缩短灾害早期的响应时间。
“[D]在开展活动时,所收集的信息对国际救援协调员来说可能是有价值的......因为它们提供了有关当地响应的见解,关于当局是否发出警报以及受影响者的一些担忧。洪水或洪水警报可能有,“该团队写道。“作为未来的研究活动,人们可以设想一个包含数十种语言的全球系统[和]在使用社交媒体作为数据源的方向上的进一步步骤,可以提供给预测模型。”