分类
布朗大学新闻

布朗大学的研究人员教计算机看到视觉错觉

通过制作一个神经网络计算机模型,可以像人类一样被视觉错觉所愚弄,研究人员提高了对人类视觉系统的认识,并可能有助于改善人工视觉。

普罗维登斯,罗德岛大学[布朗大学]-那个圆圈是绿色的还是灰色的?中心线是直的还是斜的?

视觉错觉的体验和争论都很有趣,但理解人类大脑如何感知这些不同的现象仍然是科学研究的一个活跃领域。对于一类视错觉,也就是所谓的“情境现象”,我们知道这些感知依赖于情境。例如,你认为中心圆的颜色取决于周围环的颜色。有时外部颜色会使内部颜色看起来更相似,例如相邻的绿色环使蓝色环看起来像绿松石,但有时外部颜色会使内部颜色看起来不那么相似,例如粉色环使灰色环看起来像绿色。

布朗大学(Brown University)的一个计算机视觉专家团队回到起点,研究这些情境现象的神经机制。他们的研究发表在9月20日的《心理学评论》上。

“越来越多的人一致认为,视觉错觉不是一个缺陷,而是一种特征,”布朗大学认知、语言和心理科学副教授、该论文的资深作者托马斯·塞尔(Thomas Serre)说。“我认为它们是一种特色。它们可能代表了我们视觉系统的边缘情况,但我们的视觉在日常生活和识别物体方面是如此强大。”

在这项研究中,隶属于布朗大学卡尼脑科学研究所(Brown ‘s Carney Institute For Brain Science)的Serre领导的团队从一个受视觉皮层解剖和神经生理数据约束的计算模型开始。该模型的目的是捕捉相邻的皮层神经元如何相互发送信息,并在出现复杂的刺激(如背景视错觉)时调整彼此的反应。

Serre说,研究小组在他们的模型中包含的一个创新是神经元之间假设的反馈连接的特定模式。这些反馈连接能够增加或减少——刺激或抑制——中枢神经元的反应,这取决于视觉环境。

这些反馈联系在大多数深度学习算法中并不存在。深度学习是一种功能强大的人工智能,它能够学习数据中的复杂模式,比如识别图像和解析正常语音,并且依赖于多层人工神经网络协同工作。然而,大多数深度学习算法只包括层间的前馈连接,而不包括Serre层内神经元之间的创新反馈连接。

一旦这个模型被建立起来,研究小组就会给它呈现各种与情境相关的错觉。研究人员“调整”了兴奋性或抑制性连接的反馈强度,使模型神经元的反应与灵长类视觉皮层的神经生理学数据相一致。

然后他们用不同的情境幻觉来测试这个模型,再次发现这个模型像人类一样感知这些幻觉。

为了测试他们是否使模型变得不必要的复杂,他们破坏了模型——选择性地删除了一些连接。当模型缺少一些连接时,数据与人类感知数据并不匹配。

Serre说:“我们的模型是最简单的模型,它对于解释视觉皮层在情境错觉方面的行为是必要且充分的。”“这真的是一本教科书式的计算神经科学著作——我们从一个解释神经生理学数据的模型开始,最后是对人类心理物理学数据的预测。”

除了为人类如何看待一类视错觉提供一个统一的解释外,Serre还在这个模型的基础上进行构建,其目标是改善人工视觉。

他指出,最先进的人工视觉算法,比如那些用于标记人脸或识别停车标志的算法,在识别上下文方面存在困难。他希望通过包含由上下文相关的视错觉调整的水平连接来解决这一弱点。

也许把情境考虑在内的视觉深度学习程序将更难被愚弄。塞雷说,某些贴纸贴在停车标志上,会让人工视觉系统误以为这是时速65英里的限速标志,这是很危险的。

研究小组包括布朗大学的研究生大卫·米利和博士后学者德鲁·林斯利。该研究由美国国家科学基金会(IIS-1252951)和DARPA (YFA N66001-14-1-4037)资助。

新闻旨在传播有益信息,英文原版地址:https://www.brown.edu/news/2018-09-21/illusions