图片插图由 iStock 提供
什么时候苹果不是苹果?如果你是一台电脑,答案是它什么时候被切成两半。
虽然过去几年计算机视觉取得了重大进展,但教计算机识别物体改变形状仍然难以捉摸,特别是人工智能(AI)系统。现在,马里兰大学的计算机科学研究人员正在使用我们每天改变的物体——水果和蔬菜——来解决这个问题。
他们的产品是Chop&Learn,这是一个数据集,它教机器学习系统识别各种形式的产品 – 即使它被剥皮,切片或切成碎片。
该项目于本月早些时候在巴黎举行的 2023 年计算机视觉国际会议上提出。
“你和我可以想象切片苹果或橙子与整个水果相比的样子,但机器学习模型需要大量数据来学习如何解释它,”五年级计算机科学博士生Nirat Saini说。“我们需要想出一种方法来帮助计算机像人类一样想象看不见的场景。
为了开发数据集,Saini和计算机科学博士生Hanyu Wang和Archana Swaminathan使用四个角度设置的摄像机拍摄了自己切碎七种风格的20种水果和蔬菜。
Saini说,各种角度,人员和食物准备风格对于全面的数据集是必要的。
“有人可能会在切碎苹果或土豆之前去皮,而其他人则不会。计算机将以不同的方式识别这一点,“她说。
[AI在小提琴教学平台上融入音乐传统]
除了Saini,Wang和Swaminathan之外,Chop&Learn团队还包括计算机科学博士生Vinoj Jayasundara和Bo He;Kamal Gupta博士’23,现在在特斯拉擎天柱;以及他们的顾问Abhinav Shrivastava,计算机科学助理教授。
“能够在物体经历不同转换时识别物体对于构建长期视频理解系统至关重要,”Shrivastava说,他还在马里兰大学高级计算机研究所任职。“我们相信我们的数据集是在这个问题的基本症结上取得真正进展的良好开端。
Shrivastava说,在短期内,Chop&Learn数据集将有助于推进图像和视频任务,如3D重建,视频生成以及长期视频的汇总和解析。
他说,这些进步有朝一日可能会对无人驾驶汽车的安全功能或帮助官员识别公共安全威胁等应用产生更广泛的影响。
Shrivastava说,虽然这不是近期目标,但Chop&Learn可以为机器人厨师的发展做出贡献,这种厨师可以根据命令将农产品变成厨房的健康餐点。
新闻旨在传播有益信息,英文版原文来自 https://today.umd.edu/can-chopping-fruit-help-computers-learn