分类
宾夕法尼亚大学新闻

学习的隐藏几何结构:神经网络思维相似

宾夕法尼亚大学工程师的新研究阐明了神经网络的内部工作原理,为开发超高效算法提供了可能性,该算法可以在很短的时间内对图像进行分类。

宾夕法尼亚大学的工程师们发现了一种意想不到的模式,即神经网络(引领当今人工智能革命的系统)如何学习,为人工智能中最重要的未解之谜之一提供了答案:为什么这些方法如此有效。

Artificial intelligence of modern technology represented by a brain in laptop.
图片来源: iStock/jossnatu

受生物神经元的启发,神经网络是一种计算机程序,它通过反复对控制其输出的权重或参数进行微小修改来接收数据并训练自己,就像神经元调整彼此之间的连接一样。最终结果是一个模型,允许网络预测它以前从未见过的数据。如今,神经网络基本上被用于科学和工程的所有领域,从医学到宇宙学,识别潜在的患病细胞和发现新的星系。

在《美国国家科学院院刊》(PNAS)上发表的一篇新论文中,电气与系统工程(ESE)助理教授、通用机器人、自动化、传感和感知(GRASP)实验室的核心教师Pratik Chaudhari和合著者表明,神经网络,无论其设计、大小或训练配方如何,在呈现图像进行分类时,都遵循相同的路线从无知到真相。

“假设任务是识别猫和狗的照片,”Chaudhari说。“你可能会用胡须来对它们进行分类,而另一个人可能会用耳朵的形状来分类——你会假设不同的网络会以不同的方式使用图像中的像素,有些网络肯定比其他网络取得更好的结果,但它们在学习方式上有很强的共性。这就是结果如此令人惊讶的原因。

这一结果不仅阐明了神经网络的内部工作原理,而且表明了开发超高效算法的可能性,该算法可以在很短的时间内以一小部分成本对图像进行分类。事实上,与人工智能相关的最高成本之一是开发神经网络所需的巨大计算能力。“这些结果表明,可能存在新的方法来训练他们,”Chaudhari说。

这个故事是伊恩·舍夫勒(Ian Scheffler)写的。在《今日宾夕法尼亚工程》阅读更多内容。

新闻旨在传播有益信息,英文版原文来自 https://penntoday.upenn.edu/news/penn-engineering-hidden-geometry-learning-neural-networks-think-alike