分类
普林斯顿大学新闻

Princeton students take a deep dive into deep learning computing

10月16日至17日,大约60名普林斯顿大学的研究生和博士后,以及一些本科生,探索了计算机视觉任务中最广泛使用的深度学习技术,并深入研究了使用新的并行计算程序来显著加快应用程序的速度。

Infographic showing timeline from artificial intelligence to machine learning to deep learning from the 1950s to the 2010s

自上世纪50年代乐观情绪高涨以来,人工智能的较小子集——先是机器学习,然后是深度学习——造成了前所未有的破坏。

为期两天的研讨会由英伟达深度学习研究所(NVIDIA Deep Learning Institute)的专家领导,由普林斯顿计算科学与工程研究所(PICSciE)赞助。PICSciE是普林斯顿计算研究联盟(Princeton Research Computing consortium)的一部分,由统计和机器学习中心(Center for Statistics and Machine Learning)联合赞助。

深度学习可能是机器学习中发展最快的一个分支,它以人脑分析信息和做出预测的复杂非线性方式为自己建立了松散的模型。计算机视觉程序员意识到,到3岁的时候,小孩子已经吸收了他们在周围世界看到的数亿个物体的信息;正是这些庞大而多样的数据输入训练他们在非常不同的环境中识别同一个物体。

“我们训练一个人工神经网络,以某种类似的方式识别和分类事物,”英伟达解决方案的建筑师布拉德·帕尔默(Brad Palmer)说。“在不同的情况下,该算法看到的物体越多,就越能更好地识别物体。”(普林斯顿大学教授李凯(Kai Li)是计算机科学领域的保罗·m·怀斯(Paul M. Wythes)和玛西亚·r·怀斯(Marcia R. Wythes)教授,也是PICSciE的一名相关教员。他所在的团队创建了世界上最大的视觉数据库Imagenet,这是为计算机视觉程序员提供的重要培训资源。)

深度学习研讨会的一位与会者是普林斯顿大学计算机科学博士生Ksenia Sokolova,她与Olga Troyanskaya(计算机科学教授、Lewis-Sigler整合基因组研究所和PICSciE的相关教员)一起从事一个研究项目。索科洛娃说,她之所以参加研讨会,是因为这项技术在基因组研究和精准医疗方面具有潜力。她说:“我目前正在研究一个深度学习模型,它将帮助我们更好地了解DNA突变与患者可能患有的疾病之间的相关性。”

Ksenia Sokolova and Ryan Manzuk speak in front of a chalk board

计算机科学博士生Ksenia Sokolova(右)与地球科学研究生Ryan Manzuk在Jadwin Hall举行的为期一天的深度学习研讨会上交谈。

Sokolova补充道:“基因组学非常适合深度学习;有大量复杂的数据需要解释。我认为对这些方法和应用有一个广泛的知识是很重要的,我发现这个研讨会是一个精心准备和结构化的介绍神经网络及其在计算机视觉中的应用。

“当人们开始从事深度学习时,他们没有意识到训练参数对成绩的影响程度。例如,低准确度可能是由于网络训练的方式,而不是由于网络结构。”

Troyanskaya说:“我们可以利用这些信息给出一个单一的影响评分,来表明一个突变是否出现在人类疾病的突变中,以及它是否可能具有功能。”她的跨学科团队包括生物信息学、机器学习、统计学、算法和生物学方面的专家,他们共同努力,将计算预测转化为关于阿尔茨海默氏症(Alzheimer’s disease)、自闭症、乳腺癌和肾病等不同研究领域的可测试假设。

英伟达高等教育研究团队的两名成员罗纳克•沙阿(Ronak Shah)和乔纳森•本茨(Jonathan Bentz)指出,每次他们与教职员工和学生研究人员互动时,“普林斯顿的差异”都很明显。沙阿说:“在普林斯顿大学,我们看到了一种先进的科学方法,有大量独特的本土应用程序,比如杰伦·特罗普领导的理论和计算地震学小组开发的开源软件包。”“我觉得普林斯顿大学的高研究产出与开发新的计算科学技术的研究人员数量之间存在很强的相关性。”

本茨补充说:“普林斯顿研究计算机和大学研究小组之间的关系真的很令人兴奋。PICSciE和OIT研究计算的组织方式使大学的高性能计算资源、工作人员和继续在各自领域进行开创性工作的研究小组之间进行了富有成效的合作。”