分类
耶鲁大学新闻

通过耶鲁大学的数据驱动型社会科学创造全球影响力

Emma Zang

艾玛·臧(摄影:Dan Renzetti)

这个故事是关于耶鲁大学在校长彼得·萨洛维(Peter Salovey)的领导下发展的最新故事,他准备在今年晚些时候重返教职员工。

为了了解人们在 COVID-19 大流行期间是如何四处走动的,耶鲁大学社会学家 Emma Zang 需要大量数据。当被问到时,她拿出了一系列她用来分析模式的数据集:选民登记数据、手机位置数据、信用卡交易数据、X(以前称为Twitter)数据,以及通过卫星图像捕获人口密度的净光数据,这些数据显示夜间最亮的地理区域。

Zang 解释说,传统上,绘制迁移模式需要调查数据,这需要大量的精力和时间来编译。

当你收集数据、清理数据并使用它时,它已经使用了两年,这限制了它的实用性,“耶鲁大学艺术与科学学院(FAS)社会学助理教授臧说。“这些新的、创新的数据集改变了游戏规则。

对于臧和其他社会科学家来说,包含来自政府、非营利部门和私营企业信息的大型计算机化数据集的出现正在改变他们处理工作的方式——耶鲁大学在彼得·萨洛维(Peter Salovey)总统任期内做出了回应,通过广泛投资来促进这项工作和数据驱动的社会科学的其他方面。

在过去的十年中,该大学推出了大胆的举措并建立了关键的基础设施,为数据驱动的社会科学创造了一个协作的校园环境,该环境被用于指导国内政策,应对气候变化和其他紧迫的全球挑战,并寻求了解人类的认知、价值观和行为。

社会科学研究有可能在全球范围内制定政策并影响变革,“萨洛维说,他是一位杰出的心理学家,他将在学年结束时卸任后重返社会科学研究和教学。“这需要汇集数据、理论和政策方面的深厚专业知识,促进合作,召集领导人并指导重要对话,并寻求对人际关系和社会的见解。

在耶鲁,我们致力于在这一领域引领潮流,了解紧迫的全球挑战并增加知识,不受党派或意识形态的影响。

自萨洛维于2013年开始任职以来,该大学通过聘请顶尖学者加强了社会科学学院,其中许多人在大学担任领导职务。它通过将统计系转变为统计和数据科学系,并建立经济学和计算机科学专业,向本科生传授利用数据更好地了解世界所需的技能,从而加强了社会科学教育。

耶鲁大学还开设了几个创新和跨领域的研究中心。其中包括数据密集型社会科学中心,该中心帮助大学各学者访问和管理全面、复杂的数据集,这些数据集越来越多地推动了边界不断扩大的社会科学研究;数据科学基础研究所,将数据科学方法应用于多个学科;以及托宾经济政策中心,该中心将耶鲁大学在经济学和其他领域广受认可的卓越成就应用于公共政策。

2021年,该大学成立了武仔研究所,这是一个结合神经科学、社会科学和数据科学的跨学科研究中心,旨在加速突破,解开人类认知的奥秘。

2022 年,耶鲁大学成立了耶鲁杰克逊全球事务学院,这是该大学自 1976 年以来的第一所新专业学院。

这些都是了不起的成就,“FAS政治学斯特林教授艾伦·格伯(Alan Gerber)说,他于2014年至2021年担任其首任社会科学院长,目前担任耶鲁大学社会与政策研究所所长。“通过他们,萨洛维总统创造了一个肥沃的环境,鼓励合作,使FAS和专业学校的社会科学家能够追求雄心勃勃、令人兴奋的研究,对现实世界产生影响。”

新的卓越领域

在过去的 10 年里,耶鲁大学在推进数据和分析新技术的同时,巩固了其历史优势。

托宾中心成立于 2019 年,是这种方法的典范,利用经济学、数据科学和分析的最新进展进行严格的循证研究,帮助定义和告知政策辩论。

耶鲁大学传统上在经济学方面很强,“格伯说。“托宾中心正在将这种传统的卓越扩展到一个具有巨大公共重要性的新领域。

该中心将整个校园的研究人员联合起来,追求与政策相关的奖学金,同时将他们与地方、州和联邦各级的立法者和政府官员联系起来。

例如,耶鲁大学管理学院(FAS)和耶鲁大学公共卫生学院的教职员工最近会见了康涅狄格州医疗补助计划的管理人员,讨论最新的循证研究如何加强该州的卫生系统。该中心的工作人员包括数据分析师和调查员,以支持奖学金,以及政策过程的资深人士,以帮助教师与立法者分享他们的工作。

数据驱动社会科学的精选里程碑

A timeline from 2017 to 2023 of selected milestones in data-drive social sciences Yale.

托宾中心主要支持国内领域的研究,而耶鲁大学杰克逊全球事务学院则为社会科学家提供解决国际问题的机会。其教职员工包括经济学家、政治学家、历史学家和人类学家,他们研究撒哈拉以南非洲的农业市场、专制政权和向民主的过渡、难民人口的心理健康和儿童发展以及发展中国家的教育政策,以及其他具有全球重要性的问题。

除了他们的研究之外,学校的教职员工还在帮助培训新一代的领导者,使他们能够接受使用数据来为政策提供信息。学校旨在让学生对周围的世界有深入的了解,对数据的流利程度,以及跨学科工作的敏捷性,使他们能够应对全球挑战。

杰克逊学院是一个独特的学术会议空间,涉及一系列紧迫的全球问题。我们拥有一支多学科的教师队伍——来自人文、社会科学和耶鲁大学其他专业学院的顶尖学者以及全球事务的资深从业者——相互对话,“杰克逊学院院长、查尔斯·W·古德伊尔全球事务教授吉姆·莱文森(Jim Levinsohn)说。“我们正在培训我们的学生采取这种跨学科、协作的方法,为世界面临的紧迫问题带来新的见解。”

Wu Tsai Institute是由Joseph Tsai ’86,’90 J.D.和Clara Wu Tsai捐赠建立的,连接了神经科学研究的多个领域,从生物学到心理学,从数据科学到工程学。其领导团队包括三名社会科学家和一名神经科学家:心理学教授兼研究所所长尼古拉斯·特克-布朗(Nicholas Turk-Browne);Kia Nobre,Wu Tsai心理学教授,研究所副所长兼神经认知与行为中心主任;约翰·马龙(John C. Malone)统计学和数据科学教授兼神经计算和机器智能中心主任约翰·拉弗蒂(John Lafferty);丹尼尔·科隆-拉莫斯(Daniel Colón-Ramos),多里斯·麦康奈尔·杜伯格(Dorys McConnell Duberg)神经科学和细胞生物学教授,神经发育和可塑性中心主任。

Nick Turk-Browne, Tamar Gendler, Scott Strobel, Clara Wu Tsai, Joe Tsai, Peter Salovey, Jeff Brock, and Nancy J. Brown
学院街100号落成典礼剪彩仪式左起:吴仔研究所所长Nick Turk-Browne;Tamar Gendler,艺术与科学学院院长;Scott Strobel,耶鲁大学教务长;克拉拉·吴仔(Clara Wu Tsai);蔡崇信;彼得·萨洛维总统;杰夫·布洛克(Jeff Brock),工程与应用科学学院院长;Nancy J. Brown,耶鲁大学医学院 Jean 和 David W. Wallace 院长。(摄影:Tony Fiorini)

该研究所联合了150多名跨学科的教师,包括来自四个社会科学系的教师,以大胆创新计划的方式揭示人类认知的秘密。

萨洛维总统和蔡崇信在加利福尼亚州拉霍亚的早餐会上构思了吴仔研究所,“Turk-Browne说。“他们认识到,在一个痴迷于机器智能的时代,人类的非凡能力尚未被理解,包括我们的感知、记忆、思考、决定和创造的能力。这些人类认知的奇迹是所有知识、关系、组织和追求的基本要素,因此,对它们的理解是推动社会科学发展的基础。

一个巨大的沙盒’

在过去几年中,对于社会科学的研究、教学和实践来说,也许没有比大型数据集的激增更重要的发展了。现在可用的大量信息为医疗保健、教育、政治两极分化、移民、经济不平等和气候变化以及其他紧迫问题的研究提供了信息。

几十年前,许多社会科学研究主要是理论性的,基于小型数据集,或者方法论上侧重于统计技术,旨在弥补相对较差的数据质量,“FAS的David Swensen经济学教授Steven Berry说。

计算机化提供了许多新的数据来源,这些数据成为研究人类行为、社会行为和经济行为的潜在数据集。

这些海量数据集的兴起带来了挑战。虽然马克思科学与社会科学图书馆为研究人员提供了许多重要数据集的访问权限,但他们还必须与编译这些数据集的供应商协商用户协议,设计安全存储通常包含机密信息的数据的方法,并学习计算技术,包括机器学习和人工智能,以对其进行分析。

2022 年,耶鲁大学成立了数据密集型社会科学中心 (DISSC),以帮助 FAS 和耶鲁大学专业学院的研究人员——耶鲁大学环境学院、耶鲁大学管理学院、耶鲁大学公共卫生学院、耶鲁大学杰克逊全球事务学院和耶鲁大学法学院的院系都包括社会科学家——希望访问、分析、 并保留大量数据。

教职员工总是想方设法访问和分析他们需要的数据,但 DISSC 提供的集中支持加速了这一过程,并确保所有研究人员都得到支持,Gerber 说,他与 Berry 一起担任 DISSC 的教职主任。Gerber 说,创建一个加速采用和简化人工智能和机器学习等方法使用的中心是一项“真正有远见的努力”。

作为一项向所有社会科学教师开放的大学服务,耶鲁大学与其他大学不同。

A person working in a server room
(摄影:Dan Renzetti)

在运营的第一年,DISSC 提供了编程,以帮助教职员工随时了解分析和管理数据的最新创新,开始帮助教职员工协商与供应商达成用户协议以访问数据集的繁琐过程,并与耶鲁大学亚马逊网络服务公司启动了一个试点项目,以在云上创建安全空间以安全地存储数据集。

将数据存储在一个集中位置允许多个研究人员工作,而无需移动数据集或复制它们,DISSC的首任主任Ron Borzekowski解释说。他说,如果研究人员通过清理数据或附加新变量来增加数据的价值,那么任何拥有登录授权的人都可以使用增强版本。

集中化是关键,“Borzekowski说。“他们不会在四五个不同的孤岛中工作,而是在一个巨大的沙盒中工作。”

贝里说,DISSC体现了萨洛维创造一个更加统一的耶鲁的目标。

它使整个大学的社会科学家能够从相同的基础设施中受益,“他说。“当一个问题得到解决或一个项目或一个人取得进展时,其他研究人员就可以获得这种进展。

我不知道该国有任何其他大学正在以这种规模尝试这样做。

新闻旨在传播有益信息,英文版原文来自https://news.yale.edu/2024/04/17/creating-global-impact-through-yales-data-driven-social-sciences