控制变形软体机器人的更好方法

Three orange blobs turn into the letters and spell “MIT.” Two cute cartoony blobs are in the corner smiling.

想象一下，一个类似粘液的机器人可以无缝地改变其形状以挤过狭窄的空间，这些空间可以部署在人体内部以移除不需要的物品。

虽然这种机器人在实验室之外还不存在，但研究人员正在努力开发可重新配置的软机器人，用于医疗保健、可穿戴设备和工业系统。

但是，如何控制一个没有可以操纵的关节、四肢或手指的软绵绵的机器人，而是可以随意彻底改变其整个形状呢？麻省理工学院的研究人员正在努力回答这个问题。

他们开发了一种控制算法，可以自主学习如何移动、拉伸和塑造可重构的机器人以完成特定任务，即使该任务需要机器人多次改变其形态。该团队还构建了一个模拟器，用于测试可变形软体机器人的控制算法，以完成一系列具有挑战性的变形任务。

播放视频

他们的方法完成了他们评估的八项任务中的每一项，同时优于其他算法。该技术在多方面任务中特别有效。例如，在一项测试中，机器人必须降低其高度，同时长出两条小腿以挤过狭窄的管道，然后取消这些腿并伸展其躯干以打开管道的盖子。

虽然可重构的软体机器人仍处于起步阶段，但这种技术有朝一日可以使通用机器人能够调整其形状以完成各种任务。

“当人们想到软体机器人时，他们往往会想到那些有弹性但又恢复到原来形状的机器人。我们的机器人就像粘液一样，实际上可以改变它的形态。非常令人惊讶的是，我们的方法之所以如此有效，是因为我们正在处理一些非常新的东西，“电气工程和计算机科学（EECS）研究生Boyuan Chen说，他是一篇关于这种方法的论文的合著者。

Chen的合著者包括主要作者黄苏宁，他是中国清华大学的本科生，在麻省理工学院访问期间完成了这项工作;清华大学助理教授徐华哲;资深作者Vincent Sitzmann是麻省理工学院EECS的助理教授，领导计算机科学和人工智能实验室的场景表示小组。该研究将在学习表征国际会议上发表。

控制动态运动

科学家经常使用一种称为强化学习的机器学习方法教机器人完成任务，这是一个试错过程，在这个过程中，机器人会因使其更接近目标的行为而获得奖励。

当机器人的运动部件一致且定义明确时，这就会有效，就像一个有三个手指的抓手。使用机器人抓手，强化学习算法可能会稍微移动一根手指，通过反复试验来学习该动作是否为它赢得了奖励。然后它会移动到下一个手指，依此类推。

但是，由磁场控制的变形机器人可以动态地挤压、弯曲或拉长整个身体。

An orange rectangular-like blob shifts and elongates itself out of a three-walled maze structure to reach a purple target. — 研究人员构建了一个模拟器，用于测试可变形软机器人的控制算法，以完成一系列具有挑战性的变形任务。在这里，一个可重新配置的机器人学会了拉长和弯曲其柔软的身体，以绕过障碍物并到达目标。

图片：由研究人员提供

“这样的机器人可能有数千块小肌肉需要控制，所以很难用传统方式学习，”陈说。

为了解决这个问题，他和他的合作者不得不以不同的方式思考。他们的强化学习算法不是单独移动每块微小的肌肉，而是从学习控制协同工作的相邻肌肉组开始。

然后，在算法通过关注肌肉群来探索可能的行动空间后，它会深入研究更精细的细节，以优化它所学习的策略或行动计划。这样，控制算法遵循从粗到细的方法。

“从粗到细意味着当你采取随机行动时，该随机行动可能会有所作为。结果的变化可能非常显着，因为你同时粗略地控制了几块肌肉，“Sitzmann说。

为了实现这一点，研究人员将机器人的动作空间，或者它在某个区域的移动方式，如图像一样。

他们的机器学习模型使用机器人环境的图像来生成一个 2D 动作空间，其中包括机器人及其周围区域。他们使用所谓的材料-点-方法模拟机器人运动，其中动作空间被点（如图像像素）覆盖，并用网格覆盖。

与图像中附近的像素相关（如照片中形成树的像素）一样，他们构建了自己的算法来理解附近的动作点具有更强的相关性。当机器人改变形状时，机器人“肩膀”周围的点会以类似的方式移动，而机器人“腿”上的点也会以类似的方式移动，但与“肩膀”上的点不同。

此外，研究人员使用相同的机器学习模型来观察环境并预测机器人应该采取的行动，这使得它更有效率。

构建模拟器

在开发这种方法之后，研究人员需要一种方法来测试它，因此他们创建了一个名为DittoGym的模拟环境。

DittoGym 具有八项任务，用于评估可重构机器人动态改变形状的能力。在其中一种情况下，机器人必须拉长和弯曲其身体，以便它可以绕过障碍物到达目标点。在另一种情况下，它必须改变其形状以模仿字母表中的字母。

Animation of orange blob shifting into shapes such as a star, and the letters “M,” “I,” and “T.” — 在这个模拟中，使用研究人员的控制算法训练的可重构软机器人必须改变其形状以模仿物体，如星星和字母M-I-T。

图片：由研究人员提供

“我们在 DittoGym 中的任务选择既遵循通用强化学习基准设计原则，也遵循可重构机器人的特定需求。每个任务都旨在代表我们认为重要的某些属性，例如在远距离探索中导航的能力、分析环境以及与外部物体交互的能力，“黄说。“我们相信，它们可以让用户全面了解可重构机器人的灵活性以及我们强化学习方案的有效性。”

他们的算法优于基线方法，是唯一适合完成需要多次形状变化的多阶段任务的技术。

“我们在彼此更接近的行动点之间有更强的相关性，我认为这是使这项工作如此成功的关键，”陈说。

虽然变形机器人在现实世界中部署可能还需要很多年，但Chen和他的合作者希望他们的工作不仅能激励其他科学家研究可重构的软机器人，而且还要考虑利用2D动作空间来解决其他复杂的控制问题。

新闻旨在传播有益信息，英文版原文来自https://news.mit.edu/2024/better-way-control-shape-shifting-soft-robots-0510