分类
达特茅斯大学新闻

定义社交媒体中的参与偏见

Soroush Vosoughi, Neeti Pokhriyal, and Benjamin Valentino.

调查是一种经过时间考验的机制,使决策者能够衡量公众对广泛问题的舆论脉搏。

近年来,社交媒体用户公开参与了许多与政策有关的问题,政策制定者认为这些丰富的数据是传统调查的可行替代方案,传统调查既耗时又昂贵。

然而,重要的是要意识到来自社交媒体的数据充满了偏见,根据美国国家科学基金会美国科学促进会(AAAS)科学和技术政策研究员Neeti Pokhriyal的说法,他是达特茅斯的计算机科学博士后和访问学者,以及计算机科学助理教授Soroush Vosoughi。

与旨在整理来自不同群体的意见以密切反映该国人口统计数据的调查不同,众所周知,社交媒体平台上的人口统计数据并不能真正代表更大的人口。

例如,使用社交媒体的年轻人多于后来加入这一潮流的老年人。根据皮尤研究中心 2021 年的数据,65 岁及以上的人中只有不到一半使用社交媒体网站,而 80 岁以下的人中有 80% 以上是常规用户。

更重要的是,这因平台而异。Snapchat和Instagram在很大程度上吸引了年轻用户,而Facebook的老年用户比例最高。这些是一些众所周知的因素,这些因素使来自这些来源的数据存在偏见。

还有另一种鲜为人知的偏见——在最近由Pokhriyal、Vosoughi和政府教授Benjamin Valentino共同撰写的一篇论文中首次量化——被称为参与偏见。

Pokhriyal说,这种偏见不是来自谁在平台上,而是来自他们中谁是该平台上活跃的、直言不讳的参与者。这根据所讨论的主题而有所不同。

“即使每个人都在Twitter上,他们也可能只参与某些话题 – 他们觉得有趣或在公共场合谈论的话题,”Vosoughi说。因此,他说,当一小群人对某个特定问题非常直言不讳时,他们的意见在数据中就会被过度代表。

虽然参与偏差已经在调查科学中进行了研究,但尚未在数字环境中进行分析。为了确定参与偏差的程度,研究人员建立了一个计算模型。

他们的模型着眼于社交媒体数据,并根据从同一主题的现有代表性调查中收集的数据,估计了可能参与社交媒体讨论的人口统计数据。模型的估计值与平台的实际人口统计数据之间的差异揭示了该主题的参与偏差。

在他们的论文中,他们对美国枪支管制主题进行了案例研究,将来自X的数据(在分析时称为Twitter)与来自NPR,Newshour和Marist等几个民意调查机构的调查数据进行了比较。

皮尤的人口统计数据显示,男性和女性在Twitter上的代表性相同,其用户倾向于民主党。然而,在关于枪支管制的讨论中,该模型估计共和党人和男性的权重更大。

“我们希望这种研究可以帮助将我们在社交媒体上看到的内容置于上下文中,并且还可以更轻松地跟踪公众舆论的变化,而无需进行重复的昂贵调查,”Valentino说。

Pokhriyal说,该模型还旨在解释社交媒体数据中的噪声,例如机器人生成的帖子,同时也承认他们的模型仅在有调查数据可用时才有效。

进行调查是一个资源密集型的过程,近年来,研究人员发现愿意参与的人数有所下降。Pokhriyal说,数字数据可以帮助政策制定者补充调查结果,但前提是能够充分解释现有的偏见。

新闻旨在传播有益信息,英文版原文来自https://home.dartmouth.edu/news/2023/09/defining-participation-bias-social-media