分类
加州大学伯克利分校新闻

伯克利哈斯大学的研究发现,选举民意测验有95%的自信,但只有60%的准确率

2020年10月26日星期一,马克·费舍尔在国民公园PNC钻石俱乐部的一个投票站集合。(图片由汤姆·威廉姆斯/CQ《点名》AP Images/)

你对选举民调有多自信?根据伯克利哈斯大学的一项新研究,并不像民意调查者声称的那样自信。

大多数选举民意调查的信任度为95%。然而,一项对11个选举周期的1400份民意调查的分析发现,结果在60%的情况下落在民意调查结果之内。这是选举前一周的民意调查结果——准确率会进一步下降。

“如果根据民意调查,你对2020年的选举结果很有信心,那就三思了,”伯克利大学哈斯商学院教授唐·摩尔说。他与英才20岁的前学生阿迪特亚·科塔克一起进行了这项分析。“有很多原因导致实际结果与民意调查不同,而民意调查者计算置信区间的方法并没有考虑到这些问题。

许多人感到惊讶当唐纳德·特朗普击败希拉里。克林顿总统在2016年之后拖着她在民意调查中,并推测选举民意调查越来越不准确或者很鲜见,把他们赶了出来。但摩尔和科塔克发现没有证据的准确性下降的民意调查样本回到2008 -相反,他们发现一贯自信声称在民意调查的一部分。

科塔克说:“也许我们对投票的整体解读需要调整,以解释随之而来的不确定性。”分析得出结论,事实上,要想有95%的信心,民意调查甚至需要将选举日一周后的误差幅度提高一倍。

在2019年的总统初选期间,科塔克作为一名统计学和计算机科学专业的本科生,在摩尔的准确性实验室做研究学徒,对调查中包含的置信区间越来越感兴趣。他注意到,在新闻文章和选举预测方法中,民意调查的误差幅度经常被作为脚注提到,他想知道这些调查结果是否像其误差幅度所暗示的那样准确。

科塔克把这个想法带给了摩尔,后者从心理学和统计学的角度研究过度自信。很多关于投票准确性的研究只考虑投票结果是否准确。为了衡量民意测验的可信度,他们决定追溯民意测验在选举前进行的时间,而不是考虑候选人是否赢了或输了,而是考虑选票的实际比例是否落在民意测验报告的误差范围内。例如,如果一个民意调查显示,54%的选民支持的候选人,有5%的误差,这将是准确的,如果候选人获得49%至59%的选票,但将是一个小姐,如果候选人赢得了超过59%的选票(或少于49%)。

摩尔和科塔克在2008年、2012年和2016年的大选前,以及2008年和2016年爱荷华州和新罕布什尔州的民主党总统初选和2012年和2016年同一州的共和党初选前,获得了1400次民调。由于一些民意调查涉及多个候选人,样本包括了5000多个调查的结果,这些调查是关于人们如何表示他们会对特定候选人投票,以及相应的误差范围。

他们以七天为一组的调查结果进行分析,发现调查的准确性随着距离选举越远而稳步下降,而在选举前10周,只有大约一半的调查结果被证明是准确的。这是有道理的,因为发生了不可预见的事件——比如,就在2016年总统大选前一周,前FBI局长詹姆斯•科米(James Comey)宣布对希拉里的电子邮件展开调查。然而,即便是几周后的大多数民意调查,都显示了行业标准95%的置信区间。

抽样误差和置信区间

置信区间量化了一个人的样本反映了整个选民群体的确定程度。例如,95%置信区间意味着,如果按照相同的抽样程序进行100次,其中95个样本将包含真实的选民总体。然而,问题就在这里。

置信水平考虑了“抽样误差”,这是一个统计术语,量化了样本与更大的选民群体之间纯粹偶然发生差异的可能性。例如,没有调查足够多的选民群体会增加抽样误差。但是抽样误差不包括任何其他类型的误差,比如调查一开始就选错了人。

伯克利大学政治科学系副教授David Broockman说:“人们常常忘记,民意调查的误差范围只反映了误差的统计来源。”“这一分析表明,在实践中,剩余的非统计误差来源有多大。”

伯克利政治科学学院的加布里埃尔·伦茨教授补充说:“这是一项很有意思的分析,未来的工作可能会找出不准确的来源,比如质量不高的民意调查人员、难以筛选可能的选民、选民意图在最后一刻发生变化等等。”

摩尔说,在调查统计中考虑抽样误差很容易,但考虑所有其他未知因素就困难得多。这是一个远远超出民意调查的教训。

“因为我们的信念是建立在不完美和有偏见的信息样本上的,所以有时我们会因为我们没有预料到的原因而出错,”他说。

,

新闻旨在传播有益信息,英文原版地址:https://newsroom.haas.berkeley.edu/research/election-polls-are-95-confident-but-only-60-accurate-berkeley-haas-study-finds/#new_tab