分类
麻省理工学院新闻

3个问题:Catherine D ‘Ignazio对Covid-19数据的可视化

麻省理工学院的助理教授说:“数据科学家和可视化设计师需要非常认真地对待他们在流行病中的公民角色。”

Covid-19大流行正在从世界各地产生一波又一波的数据点,记录了进行的检测数量、确诊病例、患者康复以及死于该病毒的人数。随着这些数据的不断更新,媒体、政府机构、学者和数据包装公司都在竞相弄清这些数字的意义,他们使用新颖的设计和可视化工具来绘制和绘制病毒的许多不同上下文。

一般来说,数据可视化可以帮助人们快速提取大量的数据。麻省理工学院(MIT)城市科学与规划助理教授凯瑟琳•迪伊格纳齐奥(Catherine D’ignazio)表示,在大流行期间,负责任地将数据可视化是至关重要的。

D ‘Ignazio是数据和女权主义实验室的主任,她使用数据和计算技术来实现性别和种族平等。麻省理工学院新闻与她谈论了当前Covid-19数据可视化技术的蓬勃发展,以及数据可视化技术如何帮助我们理解流行病的不确定性数字。

问:自从病毒开始传播以来,你如何看待Covid-19在过去几个月里的数据可视化演变?

答:我首先要指出的是,数据可视化已经出现了爆炸式的发展。由于有关病毒的信息是数字形式的——病例数、死亡数、检测率——因此很容易进行数据可视化。最初,确诊病例的地图、柱状图和折线图占主导地位,我想说,它们仍然是我们在媒体报道和社交媒体上看到的最常见的可视化形式。作为该领域的一个人,这种扩散既令人兴奋,因为它显示了可视化的相关性,也令人害怕,因为肯定存在一些不负责任的可视化使用。

许多知名组织都在刻度彩色地图上绘制案件计数,这是一个大禁忌,除非你已经将你的数字标准化。因此,加州,一个人口稠密的大州,在绝对的原始数据统计中,情况总是显得更糟。相反,这种绘制方法可能会导致您错过感染率高的小州,因为它们的相对病例数较低,而且在地图上总是以较浅的颜色显示。

其次,随着危机的发展,媒体正在绘制不仅仅是病例数或死亡率的地图。“变平曲线”图表有很多版本。这个很有趣,因为它不是关于绘制具体的数字,而是关于用一个假想的图表向广大受众解释一个公共卫生概念。我所见过的关于变平曲线概念的最佳视觉解释来自《华盛顿邮报》,它带有解释病毒传播的模拟和动画。也有一些可视化的例子,比如社交距离如何改变了人们的移动行为,改变了交通模式,甚至还有一个全球卫星地图,你可以看到Covid-19如何在过去三个月里减少了城市污染。

最后,这场危机带来了一些视觉传达上的难题:你如何用一种容易理解的方式来描述指数增长?我们(至少在美国)几乎没有做足够的测试来让它们成为实际案例的可靠指标,你如何从视觉上解释案例计数等数字的不确定性?

记者和卫生传播者应对这些挑战的方法是制定新的视觉习惯,并在叙述中大量使用解释和免责声明。例如,丽莎·夏洛特·罗斯特(Lisa Charlotte Rost)为DataWrapper制作的下面的图表,在y轴上使用一个对数刻度来显示指数级的变化率。但是请注意虚线的参考线,标记为“死亡人数每天翻一番”或“……每2天。这些注释有助于突出对数比例尺的使用(否则读者可能不会注意到),并解释如何解释线条的不同斜率。同样地,Rost明确表示只制作死亡率图表,而不是病例计数,因为在许多国家,检测的可用性存在差异,而且存在大量漏报。虽然实际病例可能被发现或未被统计,但死亡病例更有可能被统计。

一个来自Datawrapper的交互式图表的截图显示了由Covid-19疾病导致的累计死亡人数。图表:丽莎夏洛特罗斯特,数据包装。资料来源:Johns Hopkins CSSE。使用Datawrapper创建。

问:在挖掘可用的数据集以实现自己的可视化时,人们应该记住哪些事情?

答:这是一个很好的问题,因为在公共卫生危机中,大量的可视化和模型不仅是错误的,而且是不负责任的。这些数据通常是由那些没有流行病学专业知识的人制作的,但他们认为自己在数据科学方面的技能可以神奇地移植到一个新的领域。在此,我想对Amanda Makulec在公共卫生危机中进行负责任的数据可视化方面的出色指导大声疾呼。她的主要观点之一是,不要再制作一张Covid-19图表。这表明,数据科学家和可视化设计师需要认真对待他们在流行病中的公民角色。Makulec行推理后,设计师可以把他们正在的可视化决策支持的背景:他们的可视化能力帮助人们决定是否拒绝公共卫生指导和出去,呆在家里,感到问题的严重性不被淹没,或者恐慌和购买所有的厕纸。

数据可视化带有客观性和权威性的光环。如果设计师运用权威不负责任——例如,通过描绘病患的干净,certain-looking线当我们知道有深的不确定性在如何情况下收集计数在不同的地方——它可能耗尽公众信任,导致拒绝公共卫生指导社会距离,甚至引起恐慌。

这也适用于设计师做出的所有视觉选择。例如,颜色。Covid-19病例和死亡的可视化往往使用红色气泡或红色州和省。但是颜色有文化意义——在西方文化中,它被用来表示危险和伤害。当整个国家都笼罩在红色阴影中,或者充满了红色气泡,模糊了它的边界时,我们需要非常小心地对待轰动效应。我不是说“永远不要用红色”;在某些情况下,传达情况的严重性是必要的。但是我们对带电颜色的使用,尤其是在这样的大流行期间,涉及到做出非常谨慎的道德决定。对个别读者的风险有多严重?我们想让他们从视觉化中感受到什么?我们希望他们如何处理可视化中的信息?这些目标与公共卫生目标一致吗?

为模拟Covid-19的传播而计算致死率的复杂性。来自麦琪·柯尔特、劳拉·布朗纳和茉莉·米萨尼为fivethirtyeight.com制作的《为什么做一个好的covid19模特如此困难》。

与减少复杂性(产生轰动效应和吸引眼球的点击)不同,一些最负责任的可视化正在努力解释我们当前危机背后的复杂性。这就是上图中的情况。记者们告诉我们,为什么即使是计算死亡率这样一个简单的输入,也要依赖于许多其他的变量,既有已知的,也有未知的。

综上所述,公共卫生传播现在确实需要良好的可视化和数据科学。在-vis horizon上的一个令人兴奋的发展是数据可视化协会的一个新程序,它将具有可视化技能的人员与需要帮助的Covid-19上的组织相匹配。具体地说,这是帮助那些在危机期间需要帮助沟通数据的组织的好方法。

问:作为个人,在某些情况下,我们如何才能最好地理解和理解所报告的几乎每分钟一分钟的所有数据?

A:这周我的一个学生对我说了一些明智的话。在描述自己对每隔几分钟查看新闻的痴迷时,她反思道,“我意识到,我在寻找我找不到的答案,因为没人知道它们。”“她是对的。在这一点上,没有人能真正回答我们最基本的问题:“什么时候会结束?”我会失去我的工作吗?我的孩子什么时候回学校?我所爱的人安全吗?这将如何改变我的社区?”

再多的数据科学或数据可视化都无法为我们解决这些问题,并给我们带来我们所渴望的内心的平静。这是一个本质上不确定的时代,而我们正处于其中。我一直在告诉学生们要进行自我护理和社区护理,以此引导他们的注意力去关注那些他们能够更好地控制的事情,而不是一味地寻找诸如案例计数和情景模型之类的信息来给我们带来平静。例如,在我们的地方社区,Covid-19已经对老年人、卫生保健工作者、急救人员、家政人员、单亲父母、被监禁的人等产生了不成比例的影响。下面是一个有效的图表,突出了这些不成比例的影响。

来自蒙娜·查拉比为《卫报》撰写的《冠状病毒检疫:只有四分之一的美国人可以在家工作》。

如图所示,能够在家工作的人享有很大程度的特权:能够在家赚钱的绝大多数人是最富有的25%的劳动者。这种对权力和特权如何在数据中不平等地发挥作用的关注,也是劳伦f克莱因(Lauren F. Klein)和我最近出版的《数据女权主义》(data)一书的主线。“女权主义方法要求我们使用数据科学和可视化来揭露不平等,并朝着公平努力。

因此,虽然(负责任地)跟踪和可视化Covid-19的死亡率很重要,但我们如何也将我们的注意力集中在努力支持那些最直接和最不公平地受到这场危机影响的群体,为他们提供他们所需要的护理、设备和经济保障?现实是,即使在这种巨大的不确定性中,我们现在都可以在我们当地社区采取行动,互相支持。

新闻旨在传播有益信息,英文原版地址:http://news.mit.edu/2020/catherine-dignazio-visualizing-covid-19-data-0414