分类
麻省理工学院新闻

应对我们嘈杂世界的局限性

Tamara Broderick sits on The Alchemist sculpture on campus

塔玛拉·布罗德里克(Tamara Broderick)在高中时首次踏入麻省理工学院的校园,作为首届女性技术计划的参与者。为期一个月的暑期学术体验为年轻女性提供了工程和计算机科学的实践介绍。

几年后,她回到麻省理工学院的可能性有多大,这次是作为一名教员?

布罗德里克可能会使用贝叶斯推理来定量回答这个问题,贝叶斯推理是一种概率统计方法,它试图通过在获得新数据时不断更新假设来量化不确定性。

在麻省理工学院的实验室里,这位电气工程和计算机科学系(EECS)的新终身副教授使用贝叶斯推理来量化不确定性并衡量数据分析技术的鲁棒性。

“我一直对理解’我们从数据分析中知道什么’,而且’我们知道多少?’非常感兴趣,”布罗德里克说,他也是信息与决策系统实验室和数据、系统与社会研究所的成员。“现实情况是,我们生活在一个嘈杂的世界里,我们不能总是得到我们想要的数据。我们如何从数据中学习,同时认识到存在局限性并适当地处理它们?

从广义上讲,她的重点是帮助人们了解他们可用的统计工具的范围,有时与他们合作,为特定情况制作更好的工具。

例如,她的团队最近与海洋学家合作开发了一种机器学习模型,可以对洋流做出更准确的预测。在另一个项目中,她和其他人与退行性疾病专家合作开发了一种工具,该工具可以帮助严重运动障碍的人通过操纵单个开关来利用计算机的图形用户界面。

贯穿她作品的一个共同点是强调合作。

“可以这么说,从事数据分析工作,你可以在每个人的后院闲逛。你真的不会感到无聊,因为你总是可以学习其他领域,并思考我们如何在那里应用机器学习,“她说。

在许多学术“后院”闲逛对布罗德里克特别有吸引力,她甚至从小就努力缩小自己的兴趣范围。

数学思维

布罗德里克在俄亥俄州克利夫兰郊区长大,从她记事起就对数学感兴趣。她回忆说,如果你不断地给自己加一个数字,从1+1=2开始,然后是2+2=4,会发生什么。

“我大概5岁,所以我不知道什么是’二次方’或类似的东西。我真的很喜欢数学,“她说。

她的父亲认识到她对这门学科的兴趣,并让她参加了约翰霍普金斯大学一个名为“天才青年中心”的项目,这让布罗德里克有机会参加为期三周的暑期课程,涵盖从天文学到数论再到计算机科学的一系列学科。

后来,在高中时,她在凯斯西方大学进行天体物理学研究,并从事博士后研究。2002 年夏天,她在麻省理工学院度过了四个星期,成为女性技术项目第一班的成员。

她特别喜欢该计划提供的自由,以及它专注于利用直觉和独创性来实现高级目标。例如,该小组的任务是用乐高积木建造一个设备,他们可以用它来活检悬浮在果冻中的葡萄。

该计划向她展示了工程和计算机科学的创造力,并激起了她追求学术生涯的兴趣。

“但是当我进入普林斯顿大学时,我无法决定——数学、物理、计算机科学——它们看起来都非常酷。我想做所有这些事情,“她说。

她决定攻读本科数学学位,但选修了所有她能塞进日程表的物理和计算机科学课程。

深入研究数据分析

在获得马歇尔奖学金后,布罗德里克在英国剑桥大学学习了两年,获得了数学高级研究硕士学位和物理学哲学硕士学位。

在英国,她参加了许多统计和数据分析课程,包括她在机器学习领域的第一堂贝叶斯数据分析课。

她回忆说,这是一次变革性的经历。

“在英国期间,我意识到我真的很喜欢解决对人们很重要的现实世界问题,而贝叶斯推理被用于一些最重要的问题,”她说。

回到美国后,布罗德里克前往加州大学伯克利分校,在那里她加入了迈克尔·乔丹教授的实验室,成为一名研究生。她获得了统计学博士学位,专注于贝叶斯数据分析。

她决定在学术界从事职业,并被 EECS 部门的协作性质以及她未来的同事的热情和友好所吸引。

布罗德里克说,她在麻省理工学院找到了一个社区,帮助她发挥创造力,并通过广泛的应用探索困难的、有影响力的问题。

“我很幸运能在我的实验室里与一群非常了不起的学生和博士后一起工作——他们才华横溢、勤奋工作,他们的心在正确的地方,”她说。

她的团队最近的一个项目涉及与一位经济学家的合作,该经济学家研究在贫困地区使用小额信贷或以非常低的利率提供少量资金贷款。

小额信贷计划的目标是使人们摆脱贫困。经济学家对一个地区接受或未接受小额信贷的村庄进行随机对照试验。他们希望推广研究结果,预测如果将小额信贷应用于研究以外的其他村庄的预期结果。

但布罗德里克和她的合作者发现,一些小额信贷研究的结果可能非常脆弱。从数据集中删除一个或几个数据点可以完全改变结果。一个问题是,研究人员经常使用经验平均值,其中一些非常高或非常低的数据点可能会扭曲结果。

利用机器学习,她和她的合作者开发了一种方法,可以确定必须丢弃多少数据点才能改变研究的实质性结论。使用他们的工具,科学家可以看到结果有多脆。

“有时,丢弃一小部分数据可能会改变数据分析的主要结果,然后我们可能会担心这些结论在多大程度上推广到新的场景。有没有办法为人们标记它?这就是我们通过这项工作所要达到的目的,“她解释道。

与此同时,她继续与遗传学等多个领域的研究人员合作,以了解不同机器学习技术和其他数据分析工具的优缺点。

快乐小径

探索是 Broderick 作为研究人员的动力,也激发了她在实验室之外的热情之一。她和她的丈夫喜欢通过徒步公园或步道系统中的所有步道来收集他们获得的补丁。

“我认为我的爱好真的结合了我对户外活动和电子表格的兴趣,”她说。“有了这些远足斑块,你必须探索一切,然后你会看到你通常看不到的区域。从这个角度来说,这是冒险的。

她说,他们发现了一些他们从未知道的惊人徒步旅行,但也开始了不止几次“完全灾难性的徒步旅行”。但每一次徒步旅行,无论是隐藏的宝石还是杂草丛生的烂摊子,都有自己的回报。

就像在她的研究中一样,好奇心、开放的思想和对解决问题的热情从未让她误入歧途。

新闻旨在传播有益信息,英文版原文来自https://news.mit.edu/2024/tamara-broderick-quantifying-uncertainty-0301