分类
麻省理工学院新闻

如何避免社交节目的“赢家诅咒”

A hand presenting data on a platter, with lots of statistics in the background

早在 1980 年代,研究人员就在美国 13 个城市测试了一项名为 JOBSTART 的职业培训计划。在 12 个地点,该计划的收益微乎其微。但在加利福尼亚州的圣何塞,结果很好:几年后,工人的年收入比不参加的同龄人高出约6,500美元。因此,在 1990 年代,美国劳工部的研究人员在另外 12 个城市实施了该计划。然而,结果没有被复制。圣何塞最初的数字仍然是一个异常值。

这种情况可能是学者们称之为“赢家诅咒”的结果。当计划、政策或想法受到测试时,即使在严格的随机实验中,一次运行良好的事物也可能在下一次表现得更糟。(“赢家的诅咒”一词也指在拍卖会上高价中标,这是一个不同但相关的事情。

这个赢家的诅咒给政府官员、私营部门的公司领导人,甚至科学家都带来了一个问题:在选择经过良好测试的东西时,他们可能会买进衰落。上升的东西往往会下降。

“在人们有多种选择的情况下,他们会选择他们认为最好的一种,通常是基于随机试验的结果,”麻省理工学院经济学家以赛亚·安德鲁斯说。“你会发现,如果你再次尝试这个程序,相对于导致人们选择它的最初估计,它往往会令人失望。

安德鲁斯是新发表的一项研究的合著者,该研究研究了这种现象,并提供了研究它的新工具,这也可以帮助人们避免它。

这篇题为“赢家的推理”的论文发表在《 经济学季刊》2月刊上。作者是麻省理工学院经济系教授安德鲁斯,也是计量经济学(该领域的统计方法)专家;Toru Kitagawa,布朗大学经济学教授;以及科罗拉多大学经济学副教授亚当·麦克洛斯基(Adam McCloskey)。

区别

这项研究中提到的那种赢家诅咒可以追溯到几十年前,作为一个社会科学概念,也出现在自然科学中:正如学者们在论文中指出的那样,赢家的诅咒已经在全基因组关联研究中观察到,这些研究试图将基因与性状联系起来。

当看似值得注意的发现站不住脚时,可能有不同的原因。有时,当人们尝试复制实验或程序时,它们并不都以相同的方式运行。在其他时候,随机变化本身就会造成这种情况。

“想象一下,在这样一个世界里,所有这些程序都同样有效,”安德鲁斯说。“嗯,碰巧,其中一个会更好看,你会倾向于选择那个。这意味着你高估了它相对于其他选项的有效性。很好地分析数据有助于区分异常值结果是由于有效性的真实差异还是由于随机波动造成的。

为了区分这两种可能性,Andrews、Kitagawa 和 McCloskey 开发了分析结果的新方法。特别是,他们提出了新的估计器——一种预测结果的手段——是“中位数无偏的”。也就是说,他们同样有可能高估和低估有效性,即使在有赢家诅咒的环境中也是如此。这些方法还生成置信区间,有助于量化这些估计的不确定性。此外,学者们提出了“混合”推理方法,该方法结合了多种权衡研究数据的方法,并且正如它们所表明的那样,通常比其他方法产生更精确的结果。

通过这些新方法,Andrews、Kitagawa 和 McCloskey 在使用实验数据方面建立了更牢固的界限——包括置信区间、中位数无偏估计等。为了测试他们方法的可行性,学者们将其应用于社会科学研究的多个实例,从JOBSTART实验开始。

有趣的是,在实验结果可能成为异常值的不同方式中,学者们发现,JOBSTART的圣何塞结果可能不仅仅是随机机会的结果。结果差异很大,以至于与其他程序相比,程序的管理方式或设置可能存在差异。

西雅图测试

为了进一步测试混合推理方法,安德鲁斯、北川和麦克洛斯基随后将其应用于另一个研究问题:提供住房券的计划,以帮助人们搬入居民经济流动性更大的社区。

全国性的经济研究表明,在所有条件相同的情况下,某些地区的经济流动性比其他领域更大。在这些发现的刺激下,其他研究人员与华盛顿州金县的官员合作,制定了一项计划,以帮助代金券接受者搬到机会更高的地区。然而,对此类计划性能的预测可能容易受到赢家的诅咒,因为每个社区的机会水平估计不完美。

因此,Andrews、Kitagawa 和 McCloskey 将混合推理方法应用于在美国 50 个“通勤区”(基本上是都会区)对这种社区级数据进行测试。混合方法再次帮助他们了解先前估计的确定性。

在这种情况下的简单估计表明,对于在美国年收入第25个百分位的家庭中长大的儿童,住房搬迁计划将使成人收入增加12.25个百分点。混合推理方法表明,反而会有10.27个百分点的收益——更低,但仍然有很大的影响。

事实上,正如作者在论文中所写的那样,“即使是这个较小的估计在经济上也是很大的”,并且“我们得出的结论是,根据估计的机会来定位区域,平均可以成功地选择机会更高的区域。与此同时,学者们看到他们的方法确实有所作为。

总的来说,安德鲁斯说,“我们衡量不确定性的方式实际上可能变得不可靠。他指出,这个问题变得更加复杂,“当数据告诉我们的很少,但我们错误地过度自信,认为数据告诉我们很多。…理想情况下,你想要一些既可靠又能告诉我们尽可能多的东西。

美国国家科学基金会、英国经济和社会研究委员会和欧洲研究委员会为这项研究提供了部分支持。

新闻旨在传播有益信息,英文版原文来自https://news.mit.edu/2024/avoid-winners-curse-social-programs-0205