人工智能帮助自动驾驶汽车避免红灯怠速
没有人喜欢坐在红灯前。但信号交叉口对司机来说不仅仅是小麻烦;车辆在等待灯光变化时消耗燃料并排放温室气体。如果驾车者可以安排他们的行程,以便在绿灯时到达十字路口怎么办?虽然这对人类驾驶员来说可能只是一个幸运的突破,但可以通过使用人工智能控制其速度的自动驾驶汽车更一致地实现。
在一项新的研究中,麻省理工学院的研究人员展示了一种机器学习方法,该方法可以学习控制自动驾驶车队,当他们接近并通过信号交叉口时,以保持交通顺畅的方式行驶。
通过模拟,他们发现他们的方法可以减少燃料消耗和排放,同时提高平均车速。如果道路上的所有汽车都是自动驾驶的,该技术会得到最好的结果,但即使只有 25% 的汽车使用他们的控制算法,它仍然会带来可观的燃料和排放效益。
“这是一个非常有趣的干预场所。没有人的生活会因为被困在十字路口而变得更好。在许多其他气候变化干预措施中,生活质量存在预期差异,因此存在障碍进入那里。在这里,障碍要低得多,”资深作者、土木与环境工程系吉尔伯特 W.温斯洛职业发展助理教授、数据、系统和社会研究所成员 Cathy Wu 说。 IDSS) 和信息与决策系统实验室 (LIDS)。
该研究的主要作者是 LIDS 和电气工程与计算机科学系的研究生 Vindula Jayawardana。该研究将在欧洲控制会议上发表。
交叉路口错综复杂
虽然人类可能会不加思索地驶过绿灯,但根据车道的数量、信号的运行方式、车辆的数量及其速度、行人和骑自行车的人的存在等,交叉路口可能会呈现数十亿种不同的场景。
解决交叉口控制问题的典型方法使用数学模型来解决一个简单、理想的交叉口。这在纸面上看起来不错,但在现实世界中可能不会成立,因为那里的交通模式通常与它们来时一样混乱。
Wu 和 Jayawardana 换了个方向,使用一种称为深度强化学习的无模型技术解决了这个问题。强化学习是一种试错法,其中控制算法学习做出一系列决策。当它找到一个好的序列时,它就会得到奖励。通过深度强化学习,该算法利用神经网络学习的假设来找到通往良好序列的捷径,即使有数十亿种可能性。
这对于解决这样的长期问题很有用;Wu 解释说,控制算法必须在很长一段时间内向车辆发出超过 500 条加速指令。
她补充说:“在我们知道我们在减少排放和以良好的速度到达十字路口方面做得很好之前,我们必须正确地进行排序。”
但是还有一个额外的皱纹。研究人员希望该系统能够学习一种策略,以减少燃料消耗并限制对旅行时间的影响。这些目标可能是相互矛盾的。
“为了减少旅行时间,我们希望汽车开得快,但为了减少排放,我们希望汽车放慢速度或根本不动。这些相互竞争的奖励可能会让学习代理非常困惑,”吴说。
虽然全面解决这个问题具有挑战性,但研究人员采用了一种解决方法,使用了一种称为奖励塑造的技术。通过奖励塑造,它们为系统提供了一些它无法自行学习的领域知识。在这种情况下,只要车辆完全停止,他们就会对系统进行惩罚,因此它会学会避免这种行为。
流量测试
一旦他们开发出有效的控制算法,他们就会使用具有单个交叉口的交通模拟平台对其进行评估。该控制算法应用于连接的自动驾驶车辆车队,这些车辆可以与即将到来的交通信号灯进行通信,以接收信号相位和时间信息并观察其周围环境。控制算法告诉每辆车如何加速和减速。
当车辆接近十字路口时,他们的系统没有造成任何走走停停的交通。(当汽车由于前方交通停止而被迫完全停止时,就会发生走走停停的交通)。在模拟中,更多的汽车在一个绿色阶段通过,这优于模拟人类驾驶员的模型。与其他也旨在避免走走停停交通的优化方法相比,他们的技术导致更大的燃料消耗和排放减少。如果路上的每辆车都是自动驾驶的,他们的控制系统可以减少 18% 的燃料消耗和 25% 的二氧化碳排放量,同时将行驶速度提高 20%。
“单次干预就能减少 20% 到 25% 的燃料或排放量确实令人难以置信。但我发现有趣并且真正希望看到的是这种非线性缩放。如果我们只控制 25% 的车辆,这给了我们50% 的好处是在燃料和减排方面。这意味着我们不必等到 100% 自动驾驶汽车才能从这种方法中获益,”她说。
未来,研究人员希望研究多个交叉口之间的相互作用效应。他们还计划探索不同的交叉路口设置(车道数量、信号、时间等)如何影响行驶时间、排放和燃料消耗。此外,他们打算研究当自动驾驶汽车和人类司机共享道路时,他们的控制系统如何影响安全。例如,尽管自动驾驶汽车的驾驶方式可能与人类驾驶员不同,但较慢的道路和速度更稳定的道路可以提高安全性,Wu 说。
虽然这项工作仍处于早期阶段,但吴认为这种方法可以在短期内更可行地实施。
“这项工作的目的是推动可持续交通的发展。我们也想梦想,但这些系统是惯性的大怪物。确定对系统的微小变化但具有重大影响的干预点是早上让我起床,”她说。
标签: