分类
康奈尔大学新闻

New way to ‘see’ objects accelerates future of self-driving cars

目前用于探测自动驾驶汽车路径中的三维物体的激光传感器体积庞大、外形丑陋、价格昂贵、能耗低,而且精度很高。

这些光探测和测距(激光雷达)传感器被安装在汽车的车顶上,增加了风阻,这对电动汽车来说是一个特别的劣势。他们可以在一辆车的成本上增加大约1万美元。但尽管存在缺陷,大多数专家认为激光雷达传感器是自动驾驶汽车安全感知行人、汽车和道路上其他危险的唯一可行方法。

现在,康奈尔大学的研究人员发现了一种更简单的方法,使用挡风玻璃两侧的两个便宜的摄像头,就能以接近激光雷达的精确度和一小部分成本探测到目标。研究人员发现,从鸟瞰图而不是更传统的正面图来分析捕捉到的图像,其准确度提高了两倍以上,使得立体相机成为激光雷达可行的低成本替代品。

“自动驾驶汽车的基本问题之一是确定对象周围,显然这是一辆汽车导航的关键环境,“Kilian温伯格表示,计算机科学副教授和论文的资深作者,“从视觉深度估计Pseudo-LiDAR:弥合差距在3 d对象检测自主驾驶,”将在2019年的会议上提出计算机视觉和模式识别,在加州长滩,6月15至21。

温伯格说:“人们普遍认为,没有LiDARs,就无法生产自动驾驶汽车。”“我们已经证明,至少在原则上,这是可能的。”

本文的第一作者是王燕,计算机科学博士生。

激光雷达传感器利用激光创建周围环境的三维点图,通过光速测量物体的距离。立体摄像机,就像人眼一样,依靠两个视角来确定深度,看起来很有前途。但它们在目标检测方面的准确度低得可怜,而传统的看法是,它们太不精确了。

然后,王和他的合作者仔细观察了立体摄像机的数据。令他们惊讶的是,他们发现他们的信息几乎和激光雷达一样精确。他们发现,在分析立体摄像机的数据时,出现了精确度上的差距。

对于大多数自动驾驶汽车来说,摄像头或传感器捕捉到的数据都是使用卷积神经网络进行分析的。卷积神经网络是一种机器学习,通过应用过滤器识别与图像相关的模式来识别图像。这些卷积神经网络已经被证明非常擅长识别标准彩色照片中的物体,但如果从正面表示,它们会扭曲3D信息。因此,当王和他的同事们将图像从正面转换成从鸟瞰角度观察的点云时,准确度提高了两倍多。

温伯格说:“当你用相机拍摄图像时,你会非常、非常、非常想要正面拍摄,因为这就是相机所看到的。”“但这也存在问题,因为如果你从正面看到物体,它们被处理的方式实际上会使它们变形,你会把物体模糊到背景中,使它们的形状变形。”

最终,温伯格说,立体摄像机可能会被用作在低成本汽车上识别物体的主要方法,或者在配备激光雷达的高端汽车上作为备用方法。

“无人驾驶汽车行业一直不愿离开激光雷达,即使高成本,鉴于其出色的精度范围——在汽车对安全至关重要,”马克·坎贝尔说60和南卡罗来纳州托马斯教授John a .成熟的苏主任Sibley机械和航空航天工程学院和论文的合著者。“距离检测和精度的显著提高,加上摄像头数据的鸟瞰式表示,有可能给这个行业带来革命性的变化。”

该研究的合著者、计算机科学助理教授巴拉特•哈里哈兰(Bharath Hariharan)表示,研究结果的意义不仅限于自动驾驶汽车。

Hariharan说:“在当前的实践中,有一种趋势,即假设复杂的机器学习算法总是能够提取相关信息,那么就将数据按原样提供给这些算法。”“我们的研究结果表明,这并不一定正确,我们应该考虑一下数据是如何表示的。”

康奈尔大学博士后研究员Chao Wei-Lun和Divyansh Garg ‘ 20也有贡献。

这项研究得到了美国国家科学基金会(National Science Foundation)、美国海军研究办公室(Office of Naval research)和比尔及梅林达•盖茨基金会(Bill and Melinda Gates Foundation)的部分资助。

康奈尔纪事报
312学院,邮编:
Ithaca, NY 14850
607-255-4206
[email protected]

新闻旨在传播有益信息,英文原版地址:http://news.cornell.edu/stories/2019/04/new-way-see-objects-accelerates-future-self-driving-cars