地球与环境 2022-01-22 15:09

一头奔跑的猎豹在起伏的田野上疾驰,在崎岖不平的地形上突兀的缝隙上跳跃。这个动作看起来毫不费力,但让机器人这样移动是一个完全不同的前景。

近年来,受猎豹和其他动物运动启发的四足机器人取得了巨大的飞跃,但当它们在海拔高度急剧变化的地形上行进时,仍落后于哺乳动物同行。

“在这些情况下,你需要使用愿景来避免失败。例如,如果你看不到一个缺口,就很难避免它。尽管目前有一些将视觉与腿的运动结合起来的方法,但大多数都不适合用于新兴的敏捷机器人系统,”麻省理工学院计算机科学与人工智能实验室(CSAIL)教授、普尔基特·阿格拉沃尔实验室的博士生加布里埃尔·马戈利斯说。

现在,马戈利斯和他的同事们已经开发出了一种系统,可以提高有腿机器人在地形间隙跳跃时的速度和敏捷性。这种新型的控制系统分为两部分——一部分处理安装在机器人前端的摄像机的实时输入,另一部分将信息转化为机器人应该如何移动身体的指令。研究人员在麻省理工学院的迷你猎豹上测试了他们的系统,这是一个强大而敏捷的机器人,是在机械工程学教授Sangbae Kim的实验室里建造的。

与其他控制四足机器人的方法不同,这种由两部分组成的系统不需要预先绘制地形,所以机器人可以去任何地方。在未来,机器人可以冲进树林执行紧急响应任务,或者爬上一段楼梯,为不在家的老人送药。

马戈利斯与资深作者普尔基特·阿格拉瓦尔(Pulkit Agrawal)共同撰写了这篇论文。阿格拉瓦尔是麻省理工学院(MIT)不可思议人工智能实验室(Improbable AI lab)的负责人,也是电气工程和计算机科学系(Department of Electrical Engineering and Computer Science)的史蒂文·g·和蕾妮·芬恩(Steven G. and Renee Finn)职业发展助理教授;麻省理工学院机械工程系教授金尚培(音);以及MIT的研究生陈涛和付翔。其他合著者包括亚利桑那州立大学的研究生Kartik Paigwar;以及马萨诸塞大学阿姆赫斯特分校(University of Massachusetts at Amherst)助理教授Donghyun Kim。这项工作将在下个月的机器人学习会议上展示。

一切都在控制之中

使用两个独立的控制器一起工作使这个系统特别具有创新性。

控制器是一种算法,它将机器人的状态转换为一系列动作,让机器人遵循。许多不包含视觉的盲控制器都是健壮有效的,但只能让机器人在连续的地形上行走。

视觉是一种非常复杂的感官输入,这些算法无法有效地处理它。整合视觉的系统通常依赖于地形的“高度地图”,这必须是预先构造或动态生成的,如果高度地图不正确,这个过程通常是缓慢的,而且容易失败。

为了开发他们的系统,研究人员从这些鲁棒的、盲控制器中提取了最好的元素,并将它们与一个独立的模块相结合,以实时处理视觉。

机器人的摄像机捕捉即将到来的地形的深度图像,这些图像将与机器人身体的状态信息(关节角度、身体方向等)一起提供给高级控制器。高级控制器是一个从经验中“学习”的神经网络。

这个神经网络输出一个目标轨迹,第二个控制器用它来为机器人的12个关节提供扭矩。这种低级控制器不是神经网络,而是依靠一套简洁的物理方程来描述机器人的运动。

“这种层级结构,包括这种低级控制器的使用,使我们能够约束机器人的行为,让它表现得更得体。有了这个低级控制器,我们可以使用详细的模型,我们可以施加约束,这在基于学习的网络中通常是不可能的,”马戈利斯说。

网络教学

研究人员使用被称为强化学习的试错法来训练高级控制器。他们对机器人穿越数百个不同的不连续地形进行了模拟,并对成功穿越的机器人进行奖励。

随着时间的推移,算法学会了哪些行为会使奖励最大化。

然后,他们用一组木板搭建了一个物理的、有缝隙的地形,并用迷你猎豹来测试他们的控制方案。

“与我们的一些合作伙伴在麻省理工学院内部设计的机器人一起工作绝对是有趣的。迷你猎豹是一个很好的平台,因为它是模块化的,主要来自部分,你可以在线订购,所以如果我们想要一个新电池或相机,这只是一个简单的命令从一个常规供应商,从Sangbae一点帮助的实验室,安装它,”马戈利斯说。

在某些情况下,估计机器人的状态被证明是一个挑战。与仿真不同,真实世界的传感器会遇到噪声,这些噪声会累积并影响结果。因此,对于一些涉及高精度足部放置的实验,研究人员使用了一个动作捕捉系统来测量机器人的真实位置。

他们的系统优于其他只使用一个控制器的系统,迷你猎豹成功地穿越了90%的地形。

“我们的系统的一个新颖之处在于,它可以调整机器人的步态。如果人类想要跨越一个非常大的鸿沟,他们可能会以非常快的速度开始,以增加速度,然后他们可能会把两只脚放在一起,以一个非常有力的跨越鸿沟。以同样的方式,我们的机器人可以调整它的脚接触的时间和持续时间,以更好地穿越地形,”马戈利斯说。

从实验室跳出来

马戈利斯说,虽然研究人员能够在实验室中证明他们的控制方案是有效的,但要在现实世界中部署该系统,他们还有很长的路要走。

在未来,他们希望在机器人上安装一个更强大的计算机,这样它就可以在船上进行所有的计算。他们还想改进机器人的状态估计器,以消除对运动捕捉系统的需求。此外,他们还想改进低级控制器,这样它就可以充分利用机器人的全范围运动,并加强高级控制器,这样它就可以在不同的光照条件下工作。

Kim说:“值得注意的是,机器学习技术的灵活性能够绕过精心设计的中间过程(如状态估计和轨迹规划),这些过程是数百年来基于模型的技术所依赖的。”“我对移动机器人的未来感到兴奋,它将拥有更强大的视觉处理能力,专门针对移动进行训练。”

这项研究得到了麻省理工学院的不可思议人工智能实验室、仿生机器人实验室、NAVER实验室和DARPA机器常识项目的部分支持。