分类
芝加哥大学新闻

芝加哥大学数据科学研究所创建的新工具揭示了棕榈油生产

overhead aerial photograph showing forest to the left, and a cleared area with pale soil and runoff and several trucks to the right

棕榈油用于多种家居用品中,从包装糕点和薯片等食品到化妆品和肥皂,甚至生物燃料。但大多数棕榈油都是在单一作物种植园生产的,这些种植园生长在曾经是热带雨林和其他生物多样性生态系统的大片土地上。

绘制棕榈油厂、跨国公司和未来森林砍伐风险之间的联系是一个难以解决的数据科学问题,但芝加哥大学数据科学研究所和包容性发展国际 (IDI) 创建了一个新工具来帮助填补理解该问题的空白。

DSI 和 IDI 在第 11 小时项目的支持下,于 2 月 22 日推出了一款名为 PalmWatch 的新工具。PalmWatch使用严谨的数据科学和先进的低成本数据可视化方法,从棕榈油种植对环境和社会影响的基层到在其产品中使用棕榈油的消费品牌,追踪棕榈油供应。

“PalmWatch工具的推出已经有很长一段时间了,”芝加哥大学数据科学研究所执行主任David Uminsky说。“这具有一个伟大的数据科学问题的所有特征。

“我很高兴这个仪表板将由当地社区和在该领域工作的非营利组织拥有,”DSI 的软件工程师 Launa Greer 说。“以前,调查棕榈油供应链的影响是一个费力的过程;现在,团队将触手可及的分析。

连接数据源

为了提高透明度,跨国品牌目前确实报告了他们采购材料的棕榈油厂。然而,创建一个对世界各地的工厂进行分类和组织的存储库需要收集和标准化这些信息。即使有了这些信息,也需要额外的计算方法来了解每个工厂如何影响当地的森林砍伐风险。

PalmWatch项目最初是数据科学诊所的一部分,这是一个基于项目的体验式课程,学生在DSI教职员工的监督下担任数据科学家。

为了构建该工具,DSI的“第11小时项目”(由开放空间实验室技术负责人Dylan Halpern领导)首先必须从13个跨国消费品牌中获取公开披露信息,以显示这些品牌来自哪些工厂。

然后,这些信息必须标准化,在可搜索的地图上对棕榈油厂进行地理定位。数据科学家还必须收集有关这些工厂的信息,例如哪些公司拥有和经营它们,它们隶属于哪些消费品牌,以及它们的RSPO认证状态(衡量棕榈油生产可持续性的指标)。

格里尔说,收集信息是一个挑战。“披露通常位于网站的不起眼的角落,由于PDF布局千差万别,很难抓取信息,”她说。“我们希望向公众提供一个干净、整合和机器可读的工厂数据集,这将加速类似的供应链研究工作。”

以面向未来为目标而构建

确保PalmWatch的维护成本低廉且易于更新,这是确保网站继续成为有用的调查工具的重要部分。PalmWatch 的构建不需要大量的计算,随着时间的推移,这些计算可能会增加 Web 主机的成本。

“以社区为中心的数据科学项目的持续资金并不总是得到保证,因此从长远来看,构建廉价的软件非常重要,”DSI的开放空间实验室技术负责人Dylan Halpern说。“看到出色的软件工程和社区参与的数据科学仅仅因为服务器账单而从公众视野中消失,这是可悲的。”

完整的数据文件可供公众下载。“我们很早就意识到,棕榈油生产以独特的方式影响着世界的每一个地方;我们集成了一个协作内容管理系统,以便当地倡导者可以在各个层面(工厂、国家、消费者品牌以及介于两者之间的一切)向 PalmWatch 添加关键背景、新闻、法律简报和其他本地知识,“Halpern 说。

开发团队计划进行其他更新,包括数据管道 github、披露贡献指南,并计划为希望深入挖掘特定数据问题的社会影响组织和记者提供实践培训。

——改编自数据科学研究所首次发表的一篇文章

新闻旨在传播有益信息,英文版原文来自https://news.uchicago.edu/story/new-tool-created-uchicago-data-science-institute-sheds-light-palm-oil-production