分类
布朗大学新闻

布朗大学的本科研究员教授机器人书写和绘画

与布朗大学(Brown University)的一名教员合作,一名本科生开发了一种算法,使机器人能够通过查看手写或素描的图像来再现类似人类的笔触。

布朗大学计算机科学家开发的一种算法使机器人能够用笔写字,使用与人类笔迹相似的笔画模式。研究人员说,这是朝着机器人迈出的一步,机器人能够更流利地与人类同事和合作者交流。

布朗大学的本科生Atsunobu Kotani领导了该算法的开发,他说:“只要看一个单词或草图的目标图像,机器人就可以把每一个笔画复制成一个连续的动作。”“这使得人们很难区分它是机器人写的还是真的是人类写的。”

该算法利用深度学习网络分析手写文字或草图的图像,并能推断出产生这些图像的可能笔画序列。然后,机器人可以用它学过的笔触再现单词或草图。在本月举行的机器人与自动化国际会议上,研究人员将发表一篇论文,展示一款能够用10种不同字符集的语言写“hello”的机器人。这个机器人还能画出草图,包括一幅《蒙娜丽莎》。

布朗大学计算机科学助理教授、Kotani的顾问Stefanie Tellex说,这项工作的独特之处在于机器人从头开始学习笔画顺序的能力。

Atsu Kotani working on a computer
Atsunobu Kotani works in Stefanie Tellex’s Humans to Robots lab at Brown. Credit: Nick Dentamaro

泰利克斯说:“这一领域的许多现有工作都要求机器人提前知道行程顺序。”“如果你想让机器人写点什么,就得有人为每次的笔画顺序编写程序。有了Atsu所做的,你可以画任何你想画的东西,机器人也可以复制它。它的笔画顺序并不总是完美无缺,但却非常接近。”

泰利克斯说,这项工作的另一个引人注目的方面是,该算法如何能够推广其再现笔画的能力。Kotani用一组日文字符训练了他的深度学习算法,结果显示,该算法可以重现汉字和创造汉字的笔画,准确率约为93%。但令研究人员大为惊讶的是,该算法最终能够重现出它从未见过的非常不同的字符类型——例如,英文打印和草书。

泰利克斯说:“如果它只学会日语,我们会很高兴。”“但当它开始在英语方面发挥作用时,我们都很惊讶。然后我们决定看看能走多远。”

泰利克斯和Kotani要求所有在泰利克斯“人类到机器人”实验室工作的人用他们的母语写“你好”,其中包括希腊语、印地语、乌尔都语、汉语和意第绪语。机器人能够以合理的冲程精度再现所有这些。

泰利克斯说:“我觉得这个机器人用这么多不同的语言写东西真的很漂亮。”“我觉得这真的很酷。”

但该系统的杰作可能是它复制的小谷的《蒙娜丽莎》素描。他在泰利克斯实验室的一块干擦板上画下了自己的草图,然后让机器人在小谷正下方的同一块板上——相当忠实地——复制下来。

Robot at whiteboard
A robot was able to copy a sketch of the Mona Lisa just by looking at it.

Kotani说:“我们的机器人终于在白板上画出了蒙娜丽莎。“当我回到实验室时,每个人都围着白板看《蒙娜丽莎》,问我(机器人)是否画了这幅画。他们简直不敢相信。”

这对小谷来说是一个重要的时刻,因为“这一刻,我们的机器人定义了什么不仅仅是打印。”“喷墨打印机可以重新生成图像,但它的打印头可以前后逐行构建图像。但这是机器人用类似人类的笔触创造出的图像,对小谷浩史来说,这是“更人性化、更具表现力的东西”。

Kotani说,让这个系统工作的关键是,该算法使用了两个不同的图像模型。该算法使用全局模型,将图像作为一个整体来考虑,从而为第一次描边确定一个可能的起点。一旦描边开始,算法就会放大,逐像素观察图像,以确定描边的方向和长度。当到达笔画结束时,算法再次调用全局模型来确定下一个笔画应该从哪里开始,然后返回到放大的模型。这个过程重复,直到图像完成。

Kotani和Tellex都表示,这项工作是人类和机器人之间更好沟通的一步。最终,他们设想机器人可以留下便利贴,为他们的人类同事和合作者做记录或素描。

泰利克斯说:“我希望机器人能做人能做的所有事情。”“我对能使用语言的机器人特别感兴趣。写作是人们使用语言的一种方式,所以我们认为我们应该尝试一下。”

新闻旨在传播有益信息,英文原版地址:https://www.brown.edu/news/2019-05-15/robowrite