火星科技网您的位置:首页 >人工智能 >

一种在机器人中再现人类和动物运动的新方法

导读 近年来,开发人员创造了各种复杂的机器人,这些机器人可以在特定环境中以越来越高效的方式运行。这些系统中许多的身体结构都受到自然、动物

近年来,开发人员创造了各种复杂的机器人,这些机器人可以在特定环境中以越来越高效的方式运行。这些系统中许多的身体结构都受到自然、动物和人类的启发。

尽管许多现有的机器人具有类似于人类或其他动物物种的身体,但对它们进行编程以使其也像它们所受启发的动物一样移动并不总是一件容易的事。这样做通常需要开发先进的运动控制器,这可能需要大量的资源和开发工作。

DeepMind的研究人员最近创造了一种新技术,可用于有效地训练机器人复制人类或动物的运动。这个新工具是在arXiv上预先发表的一篇论文中介绍的,它的灵感来自以前的工作,该工作利用了代表真实世界人类和动物运动的数据,这些数据是使用动作捕捉技术收集的。

“我们研究使用人类和动物运动的先验知识来学习真正有腿机器人的可重复使用的运动技能,”DeepMind的团队在他们的论文中写道。“我们的方法建立在先前关于模仿人类或狗运动捕捉(MoCap)数据来学习运动技能模块的工作的基础上。一旦学会,这个技能模块可以重复用于复杂的下游任务。”

过去开发的机器人运动控制器的很大一部分具有模块化设计,其中一个系统被分成不同的部分(即模块),它们相互交互。虽然其中一些控制器取得了可喜的成果,但开发它们通常需要大量的工程努力。此外,模块化设计通常是特定于任务的,因此它们不能很好地概括不同的任务、情况和环境。

作为这些控制器的替代方案,一些研究人员提出了一种称为“轨迹优化”的方法,该方法将运动规划器与跟踪控制器相结合。这些方法比模块化控制器需要更少的工程设计,但它们通常需要执行大量计算,因此可能太慢而无法实时应用。

在他们的论文中,DeepMind的StevenBohez和他的同事介绍了一种替代方法,用于训练类人机器人和腿式机器人以类似于人类和动物的运动方式的方式移动。他们的技术从通过动作捕捉技术收集的数据中总结了人类和动物的运动技能,然后使用这些数据来训练现实世界的机器人。

在开发他们的方法时,该团队完成了四个主要阶段。首先,他们将动作捕捉数据重新定位到现实世界的机器人。随后,他们训练了一项策略,以在模拟环境中模拟运动捕捉数据中所需的运动轨迹。

研究人员在他们的论文中写道:“该策略具有分层结构,其中跟踪策略将所需的参考轨迹编码为潜在动作,随后指示本体感受条件的低级控制器。”

在他们训练这个策略来模仿参考轨迹之后,研究人员能够通过训练一个新的任务策略来输出潜在动作,从而重用具有固定参数的低级控制器。这允许他们的控制器在机器人中复制复杂的人类或动物运动,例如运球。最后,Bohez和他的同事将他们开发的控制器从模拟转移到了真实的硬件上。

研究人员在他们的论文中写道:“重要的是,由于MoCap数据的先验性,我们的方法不需要大量的奖励工程来在重用时产生明智和自然的行为。”“这使得创建适合部署在真实机器人上的规范化、面向任务的控制器变得容易。”

到目前为止,DeepMind的团队在模拟和现实环境中的一系列实验中评估了他们的方法。在这些测试中,他们成功地使用他们的技术训练控制器复制两种主要行为,即步行和运球。随后,他们评估了使用他们的方法在两个现实世界机器人上实现的运动质量:ANYmal四足机器人和OP3类人机器人。

Bohez和他的同事收集的结果非常有希望,这表明他们的方法可以帮助开发更真实地模仿人类和动物的机器人。在接下来的研究中,他们希望针对新的动物和人类行为训练他们的政策,然后尝试在机器人中复制它们。

研究人员在他们的论文中写道:“我们希望通过更多种类的行为来扩展我们的数据集,并进一步探索技能模块支持的下游任务范围。”

标签:

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。