面向目标模仿学习的拓扑导航图框架
最近的一项研究提出了一个框架,使从业者能够从学习的简单行为中组成目标导向的移动机器人导航系统。自主机器人导航算法有许多现有和新兴的工业应用,从工厂或医疗机器人到自动驾驶汽车。
这些算法使机器人能够行驶到任何给定的目标位置,同时使用它们的传感器(例如摄像头、激光测距仪等)观察世界以做出决定,而无需任何人工协助。
当前的商业级自主导航系统通常依赖于传统的基于工程的方法。他们对周围环境进行几何建模,估计机器人在其中的位置,并使用现有的规划算法来规划当前和给定目标位置之间的轨迹。然而,这些系统需要明确编程以处理不同的情况,因此它们的可扩展性可能被证明是昂贵的。
另一方面,基于学习的方法的研究也在学术界和工业界兴起。他们的优势在于他们从数据中学习,并且与软件开发相比,数据收集要便宜得多。
模仿学习
其中一种方法称为模仿学习。模仿学习的主要思想是通过给出一个例子来展示所需的行为(例如手动驾驶机器人),然后学习机器人感知到的东西和它应该如何行动之间的关联模型。之后,预计机器人将使用这个学习到的关联模型重复演示的行为,该模型将传感器读数转换为运动命令。
然而,模仿学习算法通常不是目标导向的,因为演示如何达到每个可能的目标实际上是不可行的。
拓扑导航图框架
Neurotechnology 的机器人研究人员最近进行的研究提出了解决这个问题的方法。它提出了一个框架,将通过模仿学习算法学习到的简单轨迹跟随行为扩展到一个特殊的结构中,称为拓扑导航图(TNG)。每个这样简单的行为都对应于环境中的一个轨迹。给定一个视觉上指定的目标,TNG 计算一系列朝向目标的轨迹,并提供一种机制,何时切换相应的轨迹跟随行为,以逐渐达到目标的方式。
因此,TNG 允许从业者利用现有的非目标导向模仿学习方法在移动机器人中进行目标导向导航。
对真实和模拟机器人进行的实验表明,TNG 框架允许将上述行为组合成一个目标导向的导航系统,当应用于模拟和真实环境时,能够达到视觉指定的目标。
标签: