想象一下,您正在考虑购买一家公司的股票。你知道它的当前价值是多少,你怀疑你可以从你的投资中获得健康的回报。但这只股票的波动性非常大:有些日子上涨,有些日子下跌。是的,你可以赚很多钱,但你也可能损失很多钱。有明确的回报,但也有很多风险。
许多决定都是这样的。在杂货店清仓的番茄酱罐头,如果它没有变质,那就很划算了,但如果变质了,你就把钱扔掉了。
像这样的决定是经济学家考虑的典型情况。加州理工学院弗莱彻·琼斯决策神经科学教授约翰·奥多尔蒂(John O’Doherty)实验室的一项新研究旨在通过测试一个计算模型来了解大脑如何实施这些决策,该模型提出了如何从经验中建立奖励和风险的表示。加州理工学院之前通过一种称为功能性磁共振成像(fMRI)的技术研究了奖励和风险的神经处理,该技术可以测量大脑内血流的变化。研究人员发现,当人们评估风险和处理不确定性时,大脑中称为前岛叶的区域被激活。
在一项新的研究中,将电极植入患者大脑深处(用于无关的治疗目的)使O’Doherty和他的团队能够在决策过程中获得更精确的大脑活动测量值。研究结果表明,正如预期的那样,所谓的奖励预测误差(期望值与观测值之间的差值)首先出现,然后是风险预测误差(预期不确定性与实际不确定性之间的差值),其依赖于与奖励预测误差相同的神经过程。这两个信号均在前岛叶中发现。这些发现表明,奖励预测误差用于计算风险预测误差,然后可用于学习评估风险性,这是决策的必要指南。
该研究成果发表在2024年3月9日的 《自然通讯》杂志上。
文森特·曼(Vincent Man)是神经科学领域的高级博士后研究员,也是该论文的合著者,他解释说:“fMRI很擅长告诉我们大脑中正在发生的事情,但它在告诉我们 事情何时 发生方面是有限的,至少在我们认为这些神经过程展开的快速时间尺度上。
在这项研究中,在爱荷华大学医院和诊所招募了接受癫痫评估的患者。为了监测他们的癫痫发作活动,这些人将电极植入了他们大脑的关键区域,包括前脑岛,这使得研究人员能够在微秒的时间尺度上检测神经活动,这是fMRI无法实现的。
然后,参与者玩一个非常简单的纸牌游戏,使用10张扑克牌,编号从A到10,A算作1。他们被要求在看不见的情况下预测第二张牌的价值是高于还是低于第一张牌。由于两张牌都不可见,这始终是一个完全随机的猜测。在显示第一张卡片后,参与者将获得一些关于他们的猜测准确性的信息。例如,如果他们预测第二张牌会更低,而第一张牌是 10,他们会立即知道他们的猜测是正确的。如果第一张牌是A,他们就会知道自己错了。但是,如果第一张牌是五,那么在第二张牌揭晓之前,结果仍然不确定。
“基本上,通过这个游戏,我们正在绘制一条从无不确定性到最大不确定性的弧线,”在O’Doherty实验室工作的Man解释道。“计算模型预测你进行一次计算并形成对风险的期望。当你看到第二张卡片时,会有第二次计算来评估预期风险。用于进行这些预测的计算被标识为奖励预测误差 (RePE) – 在预期奖励和观察到的奖励(实际抽取的牌)之间更新的过程,以及风险预测误差 (RiPE) – 评估相对于观察到的风险的预期风险的过程。
在这些游戏中,在前岛叶中检测到的活动恰好显示了卡片二显示后的两步过程:首先是奖励预测评估,然后是风险预测误差评估。
“我们正在验证一个关于回报和风险之间关系以及它们如何相互关联的理论观点,”曼说。“神经特征与理论一致这一事实很好;它为理论奠定了基础。
O’Doherty补充道:“确定大脑如何产生这些类型的计算可以帮助我们最终建立更准确的大脑如何学习和决策的模型,这不仅有助于理解大脑的一般工作方式,而且可能有助于了解这些过程在问题赌博等疾病中如何出错。 成瘾,或其他精神疾病。
这篇论文的标题是“人脑中奖励和风险的时间组织表示”。作者是加州理工学院的 Man、O’Doherty 和 Jeffrey Cockburn;南佛罗里达大学的奥利弗·弗劳蒂(Oliver Flouty);以及爱荷华大学的 Phillip E. Gander、Masahiro Sawada、Christopher K. Kovach、Hiroto Kawasaki、Hiroyuki Oya 和 Matthew A. Howard III。
新闻旨在传播有益信息,英文版原文来自https://www.caltech.edu/about/news/when-does-the-brain-process-reward-and-risk