分类
加州大学圣地亚哥分校新闻

代码与社区:计算社会科学计划用数据解决社会问题

乍一看,加利福尼亚的气候变化否认、乌克兰诗歌和学童的社交网络似乎毫无相似之处。他们的共同联系?用于分析它们的计算方法。它们也是计算社会科学(CSS)学生研究项目的例子,这是一个跨越社会科学的课程,将计算方法应用于社会问题。

加州大学圣地亚哥分校现在提供为期一年的 CSS 理学硕士学位,以及博士专业和为感兴趣的学生提供的辅修课程。

Lilly Amirjavadi 在加州大学圣地亚哥分校获得政治学学士学位,现在是 CSS 硕士课程的学生

“对于我的顶点项目,我正在与Umberto Mignozzetti教授和另外两名CSS学生合作,创建一个使用深度神经网络的机器学习工具。我们一直在开发这种算法,该算法使用多级回归和后分层来分析国家调查数据,以预测特定社会群体的政治偏好。

阿米尔贾瓦迪还指出,类似的技术经常被应用于公共卫生数据、投票模式和民意调查。

CSS将来自整个社会科学学院的定量学者联系起来,这些部门从语言学到政治学,从人类学到城市研究和规划。加州大学圣地亚哥分校(UC San Diego)的CSS项目主任兼语言学教授Will Styler解释说,CSS创造了一个空间,学者们可以用硬数据来解决社会问题,而不仅仅是关注提高计算方法的效率、开发硬件或处理数字等主题

CSS 围绕着问题,以及用于回答问题的共享方法。认知科学家可能专注于决策,经济学家可能专注于生态系统估值,但他们会使用类似的数据分析技术、模型、程序和代码。

“如果你把五个CSS教师放在一个房间里,你会得到六种关于它是什么的意见,”Styler打趣道。“我们都是社会科学家:我们对人类与世界和彼此之间的互动方式以及我们如何交流有疑问。我们的共同点是一套数据分析的方法、世界观和方法。 

与CSS和政治学联合任命的助理教学教授Mignozzetti补充说:“CSS为以社会科学为导向的学生提供了一种在学习计算的同时茁壮成长的关怀方式。我强烈推荐给任何害怕计算机的人,他们想要更深入地研究定量方法并克服他们的恐惧。

在硕士学位上取得进展

CSS 硕士学位课程于 2022 年秋季启动,为期一整个日历年。今年7月开始,为期10周的强化训练营,学生将深入探讨数据驱动的因果推理和CSS领域的子主题。在今年剩下的时间里,学生还将学习统计计算、社会科学机器学习、地理信息系统 (GIS)、时间序列分析等,并具有很大的灵活性,使他们能够专注于自己感兴趣的领域。

他们以一个最终的顶点项目结束了这一年,该项目的主题是从教师和社区提交的项目中选择的——自然语言处理 (NLP)、驱逐政策、能源定价等——最终以研究论文和演讲结束。该计划的第二批学生于 2023 年 7 月开始,共有 12 名学生,其中 75% 是女性。

“我们的硕士课程解决了社会科学计算领域通常未解决的市场,”Styler说,并补充说,许多获得本科社会科学学位的学生可能没有他们想要的所有定量方法。“人们希望提升他们的计算水平,但拥有强大的社会科学背景,或者想要重新调整他们的职业生涯并获得他们需要的技能,以回答他们提出的问题,并在就业市场上更具竞争力。

CSS 计划为 Andrew Lona ’23 准备了他目前在国会图书馆担任技术信息专家的角色,在那里他使用机器学习和光学字符识别 (OCR) 管道分析政府数据以处理文档。Lona 学习社会学、法律和社会学,但在转学到加州大学圣地亚哥分校之前,他曾在加州大学默塞德分校短暂学习计算机科学和工程学。

Lona解释说,他“一直渴望追求数据科学和机器学习”,但无法脱离他在社会学、政策、教育和语言学方面的根基。Lona 最终进入了 CSS 计划,以弥合他的激情并进一步提高他的分析能力。他解释说,他的顶点项目特别重要,他与无家可归者中心(城市研究与规划系的一个研究实体)合作,调查大流行之前、期间和之后的驱逐率变化。

“我的项目确实促使我掌握了数据整理工具、R(一种编程语言)和 ArcGIS,”Lona 说。“而且,我非常感谢我的导师Jennifer Nations,Julie Wartell和Isaac Martin,他们对我的指导和耐心。我仍然使用我从他们那里学到的很多方法!

students attend lecture
CSS学生参加高通公司蒂芙尼英语的讲座。摄影:Eileen Mehrabian。

将 CSS 集成到其他学位中

社会科学博士生还可以选择在候选资格前的学位中增加CSS专业,使他们能够用技术方法补充其所在领域的课程。该专业的入学人数正在稳步增长;申请者主要来自政治学、社会学和语言学,但并非这些学科所独有。

凯瑟琳·阿内特(Catherine Arnett)是语言学的博士候选人,她在博士学位中增加了CSS的专业,以进一步帮助她的研究。她的论文研究重点是普通话中一种称为重复的语法结构,它包括重复一个单词以改变其含义;Arnett 目前正在构建一个包含数百万个普通话重复示例的大型语料库,她计划对其进行分析。在 Ben Bergen 的实验室中,Arnett 还研究了 GPT-4 等多语言大型语言模型如何处理语言数据。

“我想增加CSS专业化,以便更好地与未来的雇主和合作者沟通我的学位实际需要什么,”Arnett说,并指出语言学以外的许多人并不真正了解语言学家的工作。 “这些课程也与我的兴趣非常吻合,让我与来自从经济学到政治学等社会科学领域的其他博士生建立了联系。

本科生还有机会在他们的学位中增加CSS的辅修课程,在那里他们需要参加三门核心CSS课程和四门来自社会科学的技术选修课。一些可能的选修课程包括网络考古学、城市数据科学和社会认知。Mignozzetti 教授的一门新课程将于 2024 年春季推出,重点是环境数据科学。

关于创造力、文化、行为和人类实践的问题是人工智能仍然薄弱的地方。这就是我们在CSS所做的;我们为学生提供了与任何程序合作的工具,以回答人工智能无法回答的这些独特的人类问题,这些问题对我们的日常生活产生了巨大影响。

威尔·斯泰勒

建立社区和计算技能

Amirjavadi 很欣赏 CSS 硕士课程的多样性以及她在那里找到的社区。

“我真正喜欢这个项目的一点是,每个人都有如此不同的背景和技能,”Amirjavadi 解释道。“有些人可能认为我们意见不一,但我一直认为这是一个优势,因为我们都可以互相帮助。如果你对社会科学的特定领域或某种编码语言并不熟悉,那么程序中的某个人可能会帮助你了解它。

Amirjavadi 于 2023 年 6 月毕业,获得政治学学士学位,辅修 CSS。她考虑了研究生院的几种可能途径,CSS硕士课程对技术技能的关注最终胜出。她补充说:“一整年都在从事这样一个量化项目,是练习和提高我的硬数据科学技能(如编码、调试和分析)的好方法。

科技领域往往会让人感到不欢迎少数族裔、女性和性别多元化的个人。CSS计划旨在改变这种状况。

“我们喜欢将CSS视为进入以问题为中心的技术世界的友好途径,”Styler解释说,并补充说,该计划的目标之一是增加以技术和数据为中心的空间的包容性,无论是在多样性方面还是在学术背景方面。“对于那些在复杂的社会结构中过着复杂生活的人来说,提出问题是很自然的。我们真的很想招收那些传统上可能不会进入技术领域的学生。

在各个级别上,参加该计划的女性人数都超过了男性,这一统计数据在以技术为重点的领域中基本不常见。该计划还吸引了捐助者加入其使命。例如,由校友雪莉·奥康纳(Shelley O’Connor)和摩根士丹利基金会(Morgan Stanley Foundation)赞助的“科技女性”项目旨在让在科技公司担任高级职位的女性每季度与学生聊聊她们的科技之旅。Women in Tech 计划还与 CREATE 合作,鼓励 K-12 学校的女孩对 STEM 教育和活动感到兴奋并参与其中。

期待

硕士课程每年3月之前接受申请。有兴趣的申请人可以 在这里申请 或联系 CSS咨询部门。作为对国际学生的额外奖励,CSS 在联邦上有资格成为 STEM 领域;CSS硕士课程的国际学生在完成课程后有资格在美国接受长达三年的选择 性实践培训 ,而无需改变其签证状态。对专业感兴趣的博士生可以 在这里了解更多信息,本科生可以在TritonLink门户网站上添加辅修课程。

至于为什么要申请?Styler说,CSS是面向未来的,并且基于质疑是什么让我们成为人类。

“我们现在所处的位置是,生成式人工智能正在创建大量代码,并且做得很好,”Styler解释说,并指出它特别擅长为数据分析编写代码。“这使得我们对问题的关注变得更加重要——关于创造力、文化、行为和人类实践的问题是人工智能仍然薄弱的地方。这就是我们在CSS所做的;我们为学生提供了与任何程序合作的工具,以回答人工智能无法回答的这些独特的人类问题,这些问题对我们的日常生活产生了巨大影响。

A man and a woman pose together
项目主任兼语言学教授威尔·斯泰勒(Will Styler)与软件工程师沙泽恩·法比尤斯(Shazeen Fabius)在“科技女性”活动中合影。摄影:Stephanie Venti。

新闻旨在传播有益信息,英文版原文来自https://today.ucsd.edu/story/computational-social-science-program-addresses-social-questions-with-data