AI分析推文以跟踪有关城市物流的对话
Twitter真正的数据消息有其用途,特别是在人工智能和机器学习领域。Chik-fil-A最近开始利用它在餐厅发现食源性疾病的迹象,联合研究中心的科学家 - 欧盟委员会的科学和知识服务 - 在今年早些时候详述了一个原型,用于衡量Twitter上的实时洪水报告用户。现在,在一个由Mines ParisTech团队牵头的新城市物流研究(“无监督机器学习分析城市物流”)中,通过机器学习算法对推文进行分析,以跟踪有关城市物流的对话趋势,尤其是低排放区域等问题。城市配送中心。
“物流的作用是在成本和客户服务方面有效地为消费者提供商品(和服务)......城市物流政策制定很复杂,因为它需要诊断和分析,因此需要观察,”共同作者写道,他指出实际障碍经常阻碍大规模的城市物流调查。“这篇论文......探讨了它如何为......观察和分析做出贡献。”
在他们的工作过程中,团队利用了两种关键的机器学习技术,称为降维和聚类。前者通过获取一组主变量来减少所考虑的变量的数量,而群集组对象的方式使得同一组中的对象与其他组中的对象相比具有更多共同点。
研究人员的机器学习模型随后在Twitter上搜索了诸如“城市物流”,“最后一英里物流”,“城市物流”和“城市货运”等词语,并收集过的推文以清除不需要的内容(如链接,符号) ,并链接单词)和重复的条目。然后将文本中的单词进行词形化 - 或者将它们组合在一起,使得它们可以作为单个项目进行分析 - 并组合成特征图。
该团队接下来使用开源自然语言工具包(NLTK)对提取的文本进行情绪分析,这是一套用于英语符号和统计自然语言处理的库和程序。他们使用Valence Aware Dictionary和Sentiment Reasoner(VADER),基于规则的情绪强度分析器和计算传统统计数据计算每个样本的极性分数(负值与正值)。
在2007年至2018年期间发布的包含关键城市物流条款的111,265条推文的数据集中,他们发现“城市物流”这一短语比“城市物流”更受欢迎(出现在66%的推文中)(9%的推文) )和“城市货运”(6%),最常见的城市物流短语与就业有关(“商业驾驶执照”,“工作”,“CDL”)。根据调查结果,该团队报告称,堪萨斯城 - 美国商业的一个重要中转站 - 与城市物流相关的活动量排在前五位最活跃的地区,并且正面的比例物流相关内容从2016年的43%增加到2018年的68%。
研究人员写道:“为了评估社交媒体挖掘可以为观察城市物流带来什么,识别代表性不足的问题和/或盲点至关重要。”“相当令人满意的是,人们可以找到相当多的问题(例如道路安全,燃料消耗,可持续性,城市结构等)和解决方案(例如培训,ICT,城市整合中心,清洁车辆,货车等)。 )...相比之下,在学术界广泛宣传的一些概念在语料库中几乎不存在(例如21篇关于物理互联网的推文,8篇关于非工作时间的交付,3篇关于同步模式)。
该团队指出,他们的方法不考虑他们留给未来工作的帐户活动水平,范围或偏见。尽管如此,他们认为Twitter对于城市物流利益相关者而言是一个“艰巨的机会”,因为该平台的规模庞大。