分类
麻省理工学院新闻

计算机科学家突破几何学的界限

Justin Solomon stands in front of a wall and is lit with dramatic pink and blue light, with grid-like shadows on the wall.Justin Solomon portrait with blurry background.

2000多年前,被许多人称为几何学之父的希腊数学家欧几里得改变了我们对形状的思考方式。

贾斯汀·所罗门(Justin Solomon)建立在这些古老的基础和数千年的数学进步的基础上,正在使用现代几何技术来解决通常似乎与形状无关的棘手问题。

例如,也许一位统计学家想要比较两个数据集,以了解使用一个数据集进行训练,另一个数据集进行测试可能会如何影响机器学习模型的性能。

麻省理工学院电气工程与计算机科学系(EECS)副教授、计算机科学与人工智能实验室(CSAIL)成员Solomon解释说,这些数据集的内容可能会共享一些几何结构,具体取决于数据在高维空间中的排列方式。例如,使用几何工具比较它们可以深入了解同一模型是否适用于两个数据集。

“我们用来谈论数据的语言通常涉及距离、相似性、曲率和形状——这正是我们在几何学中一直在谈论的那种东西。因此,几何学对数据科学中的抽象问题有很大贡献,“他说。

使用几何技术可以解决的问题的广度是所罗门给他的几何数据处理小组起一个“故意模棱两可”的名字的原因。

他的团队中约有一半致力于处理二维和三维几何数据的问题,例如在医学成像中对齐3D器官扫描,或者使自动驾驶汽车能够在LiDAR传感器收集的空间数据中识别行人。

其余的则使用几何工具进行高维统计研究,例如构建更好的生成式AI模型。例如,这些模型通过从填充了示例图像的数据集的某些部分进行采样来学习创建新图像。映射图像空间的核心是一个几何问题。

Solomon补充道:“我们针对计算机动画中的应用开发的算法几乎与当今流行的生成式AI和概率任务直接相关。

进入图形领域

所罗门早期对计算机图形学的兴趣使他踏上了成为麻省理工学院教授的旅程。

作为一名在弗吉尼亚州北部长大的数学高中生,他有机会在华盛顿郊外的一个研究实验室实习,在那里他帮助开发了3D人脸识别算法。

这段经历激发了他在斯坦福大学攻读数学和计算机科学双学位,他来到校园后热衷于投入更多的研究项目。他记得一年级时冲进校园招聘会,并在皮克斯动画工作室(Pixar Animation Studios)的暑期实习中大谈特谈。

“他们终于心软了,同意接受我的采访,”他回忆道。

在整个大学期间,他每年夏天都在皮克斯工作,直到研究生院。在那里,他专注于布料和流体的物理模拟,以提高动画电影的真实感,以及改变动画内容“外观”的渲染技术。

“图形非常有趣。它由视觉内容驱动,但除此之外,它还提出了独特的数学挑战,使其与计算机科学的其他部分区分开来,“所罗门说。

在决定开始学术生涯后,所罗门留在斯坦福大学攻读计算机科学博士学位。作为一名研究生,他最终专注于一个被称为“最佳运输”的问题,即人们试图尽可能有效地将某些物品的分布转移到另一个分配。

例如,也许有人想找到最便宜的方式将一袋袋面粉从一系列制造商运送到遍布城市的面包店。面粉运得越远,价格就越贵;最佳运输寻求最低的运输成本。

“我的关注点最初只局限于最佳运输的计算机图形应用,但研究转向了其他方向和应用,这让我感到惊讶。但是,在某种程度上,这种巧合导致了我在麻省理工学院研究小组的结构,“他说。

所罗门说,他被麻省理工学院所吸引,因为有机会与优秀的学生、博士后和同事合作,解决可能对许多学科产生影响的复杂但实际的问题。

向前支付

作为一名教职员工,他热衷于利用他在麻省理工学院的职位,让那些通常不接触几何研究领域的人能够接触到它——尤其是那些在高中或大学里往往没有机会进行研究的服务不足的学生。

为此,所罗门发起了“暑期几何计划”,这是一项为期六周的带薪研究计划,面向本科生,这些本科生大多来自代表性不足的背景。该计划提供了几何研究的实践介绍,于 2023 年完成了第三个夏天。

“没有多少机构有在我的领域工作的人,这可能导致不平衡。这意味着典型的博士申请者来自一组有限的学校。我正在努力改变这种状况,并确保那些绝对聪明但没有出生在正确地方的优势的人仍然有机会在我们地区工作,“他说。

该计划已经取得了实际成果。自成立以来,所罗门已经看到即将到来的博士生班级的组成发生了变化,不仅在麻省理工学院,而且在其他机构也是如此。

他说,除了计算机图形学之外,机器学习和统计学中还有越来越多的问题可以使用几何技术来解决,这凸显了对更多样化的研究领域的需求,他们带来了新的想法和观点。

就Solomon而言,他期待应用几何学中的工具来改进无监督机器学习模型。在无监督机器学习中,模型必须学会在没有标记训练数据的情况下识别模式。

绝大多数 3D 数据都没有标记,而在 3D 场景中手动标记对象的费用通常非常昂贵。但是,结合几何洞察力和数据推理的复杂模型可以帮助计算机找出复杂的、未标记的 3D 场景,因此模型可以更有效地从中学习。

当所罗门不思考这个和其他棘手的研究难题时,他经常会用钢琴或大提琴演奏古典音乐。他是作曲家德米特里·肖斯塔科维奇的粉丝。

作为一名狂热的音乐家,他习惯于在他搬到的任何城市加入交响乐团,目前在马萨诸塞州牛顿的新爱乐乐团演奏大提琴。

在某种程度上,这是他兴趣的和谐结合。

“音乐本质上是分析性的,而我的优势在于,我所处的研究领域——计算机图形学——与艺术实践密切相关。因此,这两者是互惠互利的,“他说。

新闻旨在传播有益信息,英文版原文来自https://news.mit.edu/2023/justin-solomon-pushing-geometric-boundaries-1212