分类
西北大学新闻

随机机器人更可靠

用于机器人的新 AI 算法始终优于最先进的系统

AI robot

西北大学的工程师开发了一种专为智能机器人设计的新型人工智能(AI)算法。通过帮助机器人快速可靠地学习复杂的技能,新方法可以显着提高机器人在一系列应用中的实用性和安全性,包括自动驾驶汽车、送货无人机、家庭助理和自动化。

该算法被称为最大扩散强化学习(MaxDiff RL),其成功在于它能够鼓励机器人尽可能随机地探索其环境,以获得多样化的体验。这种“设计的随机性”提高了机器人收集的有关自身周围环境的数据质量。而且,通过使用更高质量的数据,模拟机器人展示了更快、更高效的学习,提高了其整体可靠性和性能。

当与其他人工智能平台进行测试时,使用西北大学新算法的模拟机器人的表现始终优于最先进的模型。事实上,新算法运行得非常好,机器人学会了新的任务,然后在一次尝试中成功地执行了这些任务——第一次就做对了。这与当前的人工智能模型形成鲜明对比,后者通过反复试验可以减缓学习速度。

该研究今天(5月2日)发表在《自然机器智能》杂志上。

“其他人工智能框架可能有些不可靠,”领导这项研究的西北大学的托马斯·贝鲁埃塔(Thomas Berrueta)说。“有时他们会完全完成一项任务,但有时他们会完全失败。在我们的框架中,只要机器人能够完成任务,每次打开机器人时,你都可以期望它完全按照要求去做。这使得解释机器人的成功和失败变得更加容易,这在日益依赖人工智能的世界中至关重要。

Berrueta是西北大学的校长研究员,也是麦考密克工程学院的机械工程博士候选人。机器人专家托德·墨菲(Todd Murphey)是麦考密克大学机械工程教授,也是Berrueta的顾问,是该论文的资深作者。Berrueta和Murphey与Allison Pinosky共同撰写了这篇论文,Allison Pinosky也是Murphey实验室的博士生。

无形的脱节

为了训练机器学习算法,研究人员和开发人员使用大量大数据,人类仔细过滤和整理这些数据。人工智能从这些训练数据中学习,通过反复试验,直到达到最佳结果。虽然这个过程适用于 ChatGPT 和 Google Gemini(前身为 Bard)等非实体系统,但它不适用于机器人等具身 AI 系统。相反,机器人可以自己收集数据,而不需要人类策展人的奢侈。

对于记者:查看新闻稿
对于媒体联系人和资产

新闻旨在传播有益信息,英文版原文来自 https://news.northwestern.edu/stories/2024/05/random-robots-are-more-reliable/