随机机器人更可靠 - 美国大学新闻

AI robot

西北大学的工程师开发了一种专为智能机器人设计的新型人工智能（AI）算法。通过帮助机器人快速可靠地学习复杂的技能，新方法可以显着提高机器人在一系列应用中的实用性和安全性，包括自动驾驶汽车、送货无人机、家庭助理和自动化。

该算法被称为最大扩散强化学习（MaxDiff RL），其成功在于它能够鼓励机器人尽可能随机地探索其环境，以获得多样化的体验。这种“设计的随机性”提高了机器人收集的有关自身周围环境的数据质量。而且，通过使用更高质量的数据，模拟机器人展示了更快、更高效的学习，提高了其整体可靠性和性能。

当与其他人工智能平台进行测试时，使用西北大学新算法的模拟机器人的表现始终优于最先进的模型。事实上，新算法运行得非常好，机器人学会了新的任务，然后在一次尝试中成功地执行了这些任务——第一次就做对了。这与当前的人工智能模型形成鲜明对比，后者通过反复试验可以减缓学习速度。

该研究今天（5月2日）发表在《自然机器智能》杂志上。

“其他人工智能框架可能有些不可靠，”领导这项研究的西北大学的托马斯·贝鲁埃塔（Thomas Berrueta）说。“有时他们会完全完成一项任务，但有时他们会完全失败。在我们的框架中，只要机器人能够完成任务，每次打开机器人时，你都可以期望它完全按照要求去做。这使得解释机器人的成功和失败变得更加容易，这在日益依赖人工智能的世界中至关重要。

Berrueta是西北大学的校长研究员，也是麦考密克工程学院的机械工程博士候选人。机器人专家托德·墨菲（Todd Murphey）是麦考密克大学机械工程教授，也是Berrueta的顾问，是该论文的资深作者。Berrueta和Murphey与Allison Pinosky共同撰写了这篇论文，Allison Pinosky也是Murphey实验室的博士生。

无形的脱节

为了训练机器学习算法，研究人员和开发人员使用大量大数据，人类仔细过滤和整理这些数据。人工智能从这些训练数据中学习，通过反复试验，直到达到最佳结果。虽然这个过程适用于 ChatGPT 和 Google Gemini（前身为 Bard）等非实体系统，但它不适用于机器人等具身 AI 系统。相反，机器人可以自己收集数据，而不需要人类策展人的奢侈。

对于记者：查看新闻稿
对于媒体联系人和资产

新闻旨在传播有益信息，英文版原文来自 https://news.northwestern.edu/stories/2024/05/random-robots-are-more-reliable/