分类
麻省理工学院新闻

重新想象我们的语言理论

Ev Fedorenjo, Edward "Ted" Gibson, and Roger Levy pose together, standing on a walkway overlooking an atrium

十多年前,神经科学家埃夫·费多连科(Ev Fedorenko)要求48名说英语的人完成阅读句子、回忆信息、解决数学问题和听音乐等任务。当他们这样做时,她使用功能性磁共振成像扫描他们的大脑,看看哪些电路被激活了。如果像语言学家几十年来所提出的那样,语言与人脑中的思想有关,那么即使在非语言任务中,语言处理区域也会被激活。

费多连科2011年发表在《 美国国家科学院院刊》上的实验表明,当涉及到算术、音乐处理、一般工作记忆和其他非语言任务时,人脑的语言区域没有表现出反应。与许多语言学家所声称的相反,复杂的思想和语言是不同的东西。一个不需要另一个。“我们在大脑中有一个高度专业化的地方,对其他活动没有反应,”Fedorenko说,他是大脑与认知科学系(BCS)和麦戈文脑研究所的副教授。“思想迫切需要语言,这是不正确的。

实验的设计,利用神经科学来理解语言是如何工作的,它是如何进化的,以及它与其他认知功能的关系,是Fedorenko研究的核心。她是麻省理工学院BCS系独特的知识三合会的一部分,还有她的同事罗杰·利维(Roger Levy)和泰德·吉布森(Ted Gibson)。(吉布森和费多连科自 2007 年结婚)。他们一起进行了长达数年的合作,并建立了一个重要的研究机构,专注于语言学和人类认知中的一些最大问题。在三个独立的实验室——EvLab、TedLab和计算心理语言学实验室——工作时,研究人员的动机是对人类思维和语言在大脑中如何运作的共同迷恋。“我们有很多互动和协作,”利维说。“这是一个非常广泛的协作,智力丰富和多样化的景观。

使用计算建模,心理语言学实验,行为数据,大脑成像和大型自然语言数据集的组合,研究人员还分享了一个基本问题的答案:语言的目的是什么?在为什么我们有语言的所有可能答案中,也许最简单和最明显的是交流。“信不信由你,”泰德吉布森说,“这不是标准答案。

吉布森于1993年首次来到麻省理工学院,并于1997年加入语言学系。回忆起今天的经历,他形容它令人沮丧。当时的语言学领域以麻省理工学院语言学研究生课程的创始人之一诺姆·乔姆斯基(Noam Chomsky)的思想为主,他被称为现代语言学之父。乔姆斯基的“本土主义”语言理论认为,语言的目的是思想的表达,语言能力是在任何学习之前就已经建立起来的。但吉布森在数学和计算机科学方面的训练认为,研究人员并没有令人满意地测试这些想法。他认为,找到许多关于语言的悬而未决问题的答案需要定量研究,这与标准的语言学方法背道而驰。“没有理由只依靠你和你的朋友,这就是语言学的工作方式,”吉布森说。“如果你使用实验方法众包很多人,你可以得到的数据可以更广泛。乔姆斯基在语言学领域的崛起给吉布森带来了他所认为的挑战和机遇。“我觉得我必须详细弄清楚,看看这些说法是否属实,”他说。

在他第一次加入麻省理工学院三十年后,吉布森认为BCS的合作研究具有说服力和挑衅性,指出了思考人类文化和认知的新方法。“现在我们正处于一个阶段,不仅仅是反对。我们有很多积极的东西来说明语言是什么,“他解释道。利维补充说:“我想说,我们三个人都认为,交流在语言学习和处理中起着非常重要的作用,而且在语言本身的结构中也是如此。

Levy指出,这三位研究人员在不同学科完成了博士学位:神经科学的Fedorenko,计算机科学的Gibson,语言学的Levy。然而,在他们的道路最终在麻省理工学院汇合之前的几年里,他们对定量语言学研究的共同兴趣使他们密切关注彼此的工作并受到它的影响。三者之间的第一次合作是在2005年,重点是俄语相关条款的语言处理。吉布森回忆说,大约在那个时候,利维正在展示他所描述的“可爱的工作”,这有助于他理解语言结构和交流之间的联系。“沟通压力驱动结构,”吉布森说。“罗杰对此至关重要。很久以前,他就是那个帮助我思考这些事情的人。

Levy的实验室专注于人工智能,语言学和心理学的交叉点,使用自然语言处理工具。“我尝试使用数学和计算机科学方法为语言提供的工具,将关于语言和人类思维的科学假设形式化,并测试这些假设,”他说。

利维指出,他和吉布森之间正在进行的研究侧重于语言理解,这是合作好处的一个例子。“其中一个大问题是:当语言理解失败时,为什么会失败?”研究人员共同应用了“嘈杂信道”的概念,该概念最初由信息理论家克劳德·香农(Claude Shannon)在1950年代提出,该概念认为信息或消息在传输过程中会损坏。“语言理解随着时间的推移而展开,涉及过去与现在的持续整合,”利维说。“记忆本身是一个不完美的渠道,将过去从我们的大脑传递到现在的大脑,以支持成功的语言理解。事实上,我们语言环境的丰富性,成年后数以亿计的单词的经验,可能会创造一种统计知识,指导我们对语言意义的期望、信念、预测和解释。“语言的统计知识实际上与我们记忆的限制相互作用,”利维说。“我们的经历塑造了我们对语言本身的记忆。

这三位研究人员都表示,他们都相信,通过跟踪证据,他们最终会发现一个更大、更完整的语言故事。“这就是科学的发展方式,”费多连科说。“泰德和南希·坎维舍一起训练了我,泰德和罗杰都非常注重数据。如果数据没有给你你想到的答案,你就不会继续推动你的故事。你会想到新的假设。我所做的几乎所有事情都是这样。有时,费多连科对大脑语言系统部分的研究让她感到惊讶,迫使她放弃她的假设。“在某个项目中,我有一个先验的想法,即关心组合学和单词含义的部分之间会有一些分离,”她说,“但语言系统的每一点都对两者都很敏感。在某些时候,我想,这就是数据告诉我们的,我们必须顺其自然。

研究人员的工作指出,交流是语言的构成目的,为探索和研究非人类语言开辟了新的可能性。标准的说法是,人类语言的词汇比没有语法的动物要广泛得多。“但很多时候,我们甚至不知道其他物种在交流什么,”吉布森说。“我们说他们无法沟通,但我们不知道。我们不会说他们的语言。Fedorenko希望能够提供更多进行跨物种语言比较的机会。“了解事物相似的地方和分歧的地方将非常有用,”她说。

同时,语言研究的潜在应用是深远的。Levy目前的研究项目之一侧重于人们如何阅读和使用由眼球运动心理学提供的机器学习算法来开发能力测试。通过跟踪将英语作为第二语言的人在阅读英语文本时的眼球运动,Levy可以预测他们的英语水平,这种方法有朝一日可能会取代英语作为外语的测试。“这是一种隐含的语言衡量标准,而不是更具游戏性的测试,”他说。

研究人员一致认为,语言神经科学中一些最令人兴奋的机会在于大型语言模型,这些模型为提出新问题和做出新发现提供了新的机会。“在语言的神经科学中,我们能够讲述的关于大脑如何做语言的故事仅限于口头的描述性假设,”Fedorenko说。她补充说,计算实现的模型现在非常擅长语言,并且显示出与大脑的某种程度的对齐。现在,研究人员可以提出这样的问题:细胞正在做哪些实际计算来从单词串中获得意义?“你现在可以使用这些模型作为工具来深入了解人类如何处理语言,”她说。“你可以把模型拆开,你不能拆开大脑。

新闻旨在传播有益信息,英文版原文来自https://news.mit.edu/2023/re-imagining-our-theories-of-language-0922