麻省理工学院的研究人员发明了一种方法,可以有效地优化软机器人的控制和目标任务的设计,这在传统上是一个巨大的计算任务。

软机器人有弹性、灵活、有弹性的身体,在任何给定的时刻都可以以无限的方式移动。在计算上,这代表了一个高度复杂的“状态表示”,它描述了机器人的每个部分是如何移动的。软机器人的状态表示可能有数百万个维度,因此很难计算出让机器人完成复杂任务的最佳方式。

在下个月的神经信息处理系统会议上,麻省理工学院的研究人员将提出一个模型,该模型基于机器人的基本物理特性和它的环境,以及其他因素,学习一个紧凑的,或“低维”的,但详细的状态表示。这有助于模型迭代地协同优化运动控制和满足特定任务的材料设计参数。

计算机科学与人工智能实验室(CSAIL)的研究生、第一作者安德鲁•斯皮尔伯格(Andrew Spielberg)表示:“软机器人是无限维度的生物,在任何给定时刻都会以10亿种不同的方式弯曲。”但事实上,柔软的物体有可能以自然的方式弯曲。我们发现软机器人的自然状态可以用一个低维的描述来描述。我们通过学习可能状态的良好描述来优化软机器人的控制和设计。”

在模拟中,该模型使2D和3D软机器人能够完成任务——例如移动一定距离或到达目标点——比当前最先进的方法更快更准确。研究人员下一步计划将该模型应用到真正的软机器人上。

与斯皮尔伯格一起发表论文的还有中国科学院研究生赵艾伦、杜涛和胡元明;CSAIL主任、电气工程和计算机科学的Andrew和Erna Viterbi教授Daniela Rus;和Wojciech Matusik,麻省理工学院电子工程和计算机科学副教授,计算制造小组的负责人。

“Learning-in-the-loop”

软机器人是一个相对较新的研究领域,但它有望成为先进的机器人。例如,灵活的身体可以提供与人类更安全的互动,更好的对象操作,更多的可操作性,以及其他好处。

在模拟中,机器人的控制依赖于一个“观察者”,一个计算变量的程序,可以看到软机器人如何移动来完成一个任务。在之前的工作中,研究人员将软机器人分解成手工设计的模拟粒子簇。粒子包含的重要信息有助于缩小机器人可能的运动范围。例如,如果一个机器人试图以某种方式弯曲,执行器可能会对这种运动产生足够的抗拒,以至于可以忽略它。但是,对于这样复杂的机器人来说,手动选择在模拟过程中跟踪哪些集群是很困难的。

在此基础上,研究人员设计了一种“在循环中学习优化”的方法,其中所有优化的参数都是在多次模拟的单个反馈循环中学习的。并且,与学习优化(或“在循环中”)同时,该方法还学习状态表示。

该模型采用了一种被称为材料点法(MPM)的技术,该技术模拟了被背景网格包围的连续介质(如泡沫和液体)粒子的行为。在此过程中,它将机器人的粒子及其可观察环境捕获为像素或三维像素,即所谓的体素,而不需要任何额外的计算。    

在学习阶段,这个原始的粒子网格信息被输入到一个机器学习组件中,这个机器学习组件学习输入图像,将其压缩成一个低维的表示,然后将该表示解压缩回输入图像。如果这个“自动编码器”在压缩输入图像时保留足够的细节,它可以准确地重新创建压缩后的输入图像。

在研究人员的工作中,自动编码器的学习压缩表示作为机器人的低维状态表示。在优化阶段,该压缩表示将循环回到控制器中,控制器将输出一个计算过的驱动器,用于机器人的每个粒子在下一个mpm模拟步骤中应该如何移动。

同时,控制器利用这些信息来调整每个粒子的最佳刚度,以实现其期望的运动。在未来,这些材料信息可以用于3d打印软机器人,其中每个粒子点可以打印稍微不同的刚度。斯皮尔伯格说:“这使得我们可以根据机器人的动作设计出与特定任务相关的机器人。”“通过把这些参数放在一起学习,你可以尽可能地让所有东西保持同步,让设计过程变得更容易。”

更快的优化

所有的优化信息依次反馈到循环的开始,以训练自动编码器。在多次模拟中,控制器学习最优运动和材料设计,而自动编码器学习越来越详细的状态表示。“关键是我们希望这种低维度的状态是非常描述性的,”斯皮尔伯格说。

当机器人在设定的时间内到达它模拟的最终状态——比如,尽可能接近目标目的地——它会更新一个“损失函数”。这是机器学习的一个重要组成部分,它试图最小化一些错误。在这种情况下,它最小化了,比如说,机器人离目标的距离。该丢失函数流回控制器,控制器使用错误信号来调整所有优化参数,以最佳地完成任务。

如果研究人员试图直接将模拟的所有原始粒子输入控制器,而没有压缩步骤,“运行和优化时间将会爆炸,”斯皮尔伯格说。通过使用压缩表示,研究人员能够将每次优化迭代的运行时间从几分钟减少到大约10秒。

研究人员在各种2D和3D的两足和四足机器人上验证了他们的模型。研究人员还发现,虽然使用传统方法的机器人可以进行多达3万个模拟来优化这些参数,但在他们的模型上训练的机器人只进行了大约400个模拟。

将该模型部署到真实的软机器人中意味着处理现实世界中的噪音和不确定性问题,这些问题可能会降低模型的效率和准确性。但是,在未来,研究人员希望为软机器人设计一个完整的管道,从模拟到制造。

新闻旨在传播有益信息,英文原版地址:http://news.mit.edu/2019/model-design-control-robots-target-1122