研究人员帮助机器人抽象地思考和计划

普罗维登斯，R.I.[布朗大学]——布朗大学和麻省理工学院的研究人员开发了一种方法，通过构造机器人周围世界的抽象表征，帮助它们规划多步骤任务。他们的研究发表在《人工智能研究杂志》(Journal of Artificial Intelligence Research)上，这是朝着制造能像人一样思考和行动的机器人迈出的一步。

规划对机器人来说是一件极其困难的事情，很大程度上是因为它们如何感知和与世界互动。机器人对世界的感知不过是由相机收集的大量像素组成的，它的行动能力仅限于设置控制其关节和抓手的单个马达的位置。它缺乏对这些像素如何与我们可能认为世界上有意义的概念相关联的内在理解。

布朗大学计算机科学助理教授、这项新研究的主要作者乔治科尼达里斯(George Konidaris)说:“这种与外界的低层次互动让我们很难决定该做什么。”“想象这会有多难计划像去杂货店一样简单的事情如果你必须考虑每一个肌肉你flex,提前想象和详细tb的视觉数据,通过你的视网膜。你会立刻陷入细节中。当然，人们不会那样计划。我们能够引入抽象概念，抛弃大量无关的细节，只关注重要的东西。”

即使是最先进的机器人也无法做到这种抽象。科尼达里斯说，当我们看到机器人规划和执行多步骤任务的演示时，“几乎总是程序员明确地告诉机器人如何思考世界，以便让它制定计划。”“但如果我们想让机器人能够更自主地行动，它们就需要具备自主学习抽象的能力。”

在计算机科学术语中，这类抽象可分为两类:“过程抽象”和“感知抽象”。程序抽象是由低层次的动作组成的程序，这些动作被组合成更高层次的技能。举个例子，把开门所需的所有小动作——伸手去抓门把手、转动门把手、把门拉开所涉及的所有运动——都捆绑成一项“开门”技能。一旦建立了这样的技能，就不需要担心它是如何工作的了。你只需要知道什么时候运行它。他说，机器人专家——包括科尼达里斯本人——多年来一直在研究如何让机器人学习过程抽象。

但据科尼达里斯说，在感知抽象方面的进展较少，这与帮助机器人理解像素化的环境有关。这就是这项新研究的重点。

科尼达里斯说:“我们的研究表明，一旦机器人拥有高级的运动技能，它就能自动构建一个兼容的高级符号来表示世界——一个可以证明适合使用这些技能进行规划的符号。”

学习抽象的世界状态

在这项研究中，研究人员将一个名为Anathema Device(简称Ana)的机器人引入一个房间，这个房间里有一个橱柜、一个冷却器、一个控制柜内灯光的开关，以及一个可以放在冰箱或橱柜里的瓶子。他们给安娜提供了一套高级的运动技能来操纵房间里的物体——打开和关闭冷藏箱和橱柜，翻转开关，拿起一个瓶子。然后他们让安娜放松，在房间里测试她的运动技能，记录每次技能执行前后她的相机和执行器的感官数据。这些数据被输入到该团队开发的机器学习算法中。

研究人员表明，安娜能够学习到一种非常抽象的环境描述，其中只包含了她具备某种特定技能所必需的东西。例如，她了解到，为了打开冷却器，她需要站在冷却器前面，不拿任何东西(因为她需要双手来打开盖子)。她还学会了在她的视野中与正在关闭的冷却器盖相关联的像素的正确配置，这是唯一可能打开盖子的配置。

Animated configuration of pixels associated with a cooler — Just by executing her motor skills, Ana learned the appropriate configuration of pixels associated with a cooler having a closed lid, a necessary condition for her to run her “open the cooler” skill.

她学习了与其他技能相关的类似抽象概念。比如，她发现橱柜里的灯太亮了，把她的传感器都照亮了。所以为了控制柜子里的瓶子，她必须关灯。她还了解到，为了关灯，柜子的门必须关上，因为打开的门挡住了她接近开关的路。由此产生的抽象表示将所有这些知识从高清图像提取到一个只有126行长的文本文件中。

“这些都是关于她周围环境的重要抽象概念，”科尼达里斯说。“门在被打开之前需要被关闭。你不能把瓶子从柜子里拿出来，除非它是开着的，等等。她能够通过运用自己的技能来学习这些技能，并观察会发生什么。”

抽象规划

一旦安娜学会了抽象表达，研究人员要求她做一些需要计划的事情:把瓶子从冷藏箱里拿出来，放到碗柜里。

正如他们所希望的那样，安娜走到冷藏箱前，打开冷藏箱，露出了瓶子。但是她没有把它捡起来。相反，她提前做了计划。她意识到如果她的手握着瓶子，那么她就无法打开碗柜，因为这样做需要双手。所以当她打开冷藏箱后，她找到了橱柜。在那里，她看到灯的开关在“开”的位置，她意识到打开橱柜会挡住开关，所以她在打开橱柜之前关掉了开关，回到冷藏箱拿回瓶子，最后把它放在橱柜里。简而言之，她提前计划，发现问题，并在问题发生之前解决它们。

科尼达里斯说:“我们没有为安娜提供任何她计划这项任务所需的抽象表现。”她自己学会了这些抽象概念，一旦学会了，做计划就很容易了。她只花了4毫秒就找到了这个计划。”

科尼达里斯说，这项研究为将人工智能应用于机器人提供了一个重要的理论基础。他说:“我们相信，让我们的机器人在抽象而非具体的环境中规划和学习，将是建造真正智能机器人的基础。”“如果你用正确的方式思考，很多问题往往都很简单。”

科尼达里斯论文的合著者是来自麻省理工学院的莱斯利·帕克·凯尔布林(Leslie Pack Kaelbling)和托马斯·洛扎诺-佩雷斯(Tomas Lozano-Perez)。这项研究得到了美国国防高级研究计划局和麻省理工学院情报计划的支持。

新闻旨在传播有益信息，英文原版地址：https://www.brown.edu/news/2018-02-08/robotplanning