通过基于人工智能的风险预测实现早期胰腺癌干预的新希望

Drawing of a large group of people from an aerial perspective forming a distorted oval shape. Several individuals are standing apart from the formation.

第一例记录在案的胰腺癌病例可以追溯到 18 世纪。从那时起，研究人员进行了漫长而具有挑战性的奥德赛，以了解这种难以捉摸的致命疾病。迄今为止，没有比早期干预更好的癌症治疗方法了。不幸的是，位于腹部深处的胰腺对于早期发现特别难以捉摸。

麻省理工学院计算机科学和人工智能实验室（CSAIL）的科学家与贝丝以色列女执事医疗中心（BIDMC）放射肿瘤学系的科学家 Limor Appelbaum 一起，渴望更好地识别潜在的高危患者。他们着手开发两种机器学习模型，用于早期检测胰腺导管腺癌（PDAC），这是最常见的癌症形式。为了访问广泛而多样化的数据库，该团队使用来自美国各个机构的电子健康记录数据，与一家联合网络公司同步。这个庞大的数据池有助于确保模型的可靠性和泛化性，使其适用于广泛的人群、地理位置和人口群体。

这两个模型——“棱镜”神经网络和逻辑回归模型（一种概率统计技术）优于当前的方法。该团队的比较表明，虽然标准筛查标准使用高出五倍的相对风险阈值识别出约10%的PDAC病例，但Prism可以在相同的阈值下检测到35%的PDAC病例。

使用人工智能检测癌症风险并不是一个新现象——算法可以分析乳房 X 光检查、肺癌的 CT 扫描，并协助分析巴氏涂片检查和 HPV 检测，仅举几例。麻省理工学院电气工程和计算机科学（EECS）博士生、麻省理工学院CSAIL附属机构、电子 生物医学 开放获取论文的第一作者Kai Jia说：“PRISM模型因其在超过500万患者的广泛数据库中的开发和验证而脱颖而出，超过了该领域大多数先前研究的规模概述新工作。“该模型使用常规临床和实验室数据进行预测，与其他PDAC模型相比，美国人口的多样性是一个重大进步，这些模型通常局限于特定的地理区域，如美国的一些医疗保健中心。

“这份报告概述了一种强大的方法，使用大数据和人工智能算法来完善我们识别癌症风险状况的方法，”哈佛医学院教授、癌症中心主任兼血液学和血液系统恶性肿瘤主任David Avigan说，他没有参与这项研究。“这种方法可能会导致新的策略来识别恶性肿瘤高风险患者，这些患者可能受益于具有早期干预潜力的重点筛查。

棱镜视角

PRISM的发展之旅始于六年多前，其动力来自当前诊断实践局限性的第一手经验。“大约80-85%的胰腺癌患者在晚期被诊断出来，治愈不再是一种选择，”资深作者Appelbaum说，他也是哈佛医学院的讲师和放射肿瘤学家。“这种临床上的挫败感激发了深入研究电子健康记录（EHR）中大量可用数据的想法。”

CSAIL小组与Appelbaum的密切合作使得能够更好地理解该问题的医学和机器学习方面，最终导致一个更加准确和透明的模型。“假设这些记录包含隐藏的线索 – 微妙的迹象和症状，可以作为胰腺癌的早期预警信号，”她补充道。“这指导了我们在开发这些模型时使用联合 EHR 网络，为在医疗保健中部署风险预测工具提供了一种可扩展的方法。”

PrismNN 和 PrismLR 模型都分析了 EHR 数据，包括患者人口统计、诊断、药物和实验室结果，以评估 PDAC 风险。PrismNN 使用人工神经网络来检测年龄、病史和实验室结果等数据特征中的复杂模式，从而生成 PDAC 可能性的风险评分。PrismLR 使用逻辑回归进行更简单的分析，根据这些特征生成 PDAC 的概率分数。总之，这些模型对从相同的 EHR 数据预测 PDAC 风险的不同方法进行了全面评估。

该团队指出，获得医生信任的一个关键点是更好地理解模型的工作原理，这在该领域被称为可解释性。科学家们指出，虽然逻辑回归模型本质上更容易解释，但最近的进展使深度神经网络在某种程度上更加透明。这有助于该团队将来自单个患者 EHR 的数千个潜在预测特征细化为大约 85 个关键指标。这些指标，包括患者年龄、糖尿病诊断和就诊频率的增加，由模型自动发现，但与医生对胰腺癌相关风险因素的理解相匹配。

前进的道路

尽管PRISM模型很有希望，但与所有研究一样，某些部分仍在进行中。仅美国数据就是这些模型的当前饮食，需要进行测试和调整以供全球使用。该团队指出，前进的道路包括扩大该模型对国际数据集的适用性，并整合其他生物标志物以进行更精细的风险评估。

“我们的后续目标是促进这些模型在常规医疗保健环境中的实施。我们的愿景是让这些模型在医疗保健系统的后台无缝运行，自动分析患者数据并提醒医生注意高风险病例，而不会增加他们的工作量，“贾说。“与 EHR 系统集成的机器学习模型可以使医生能够为高危患者提供早期警报，从而有可能在症状出现之前进行干预。我们渴望在现实世界中部署我们的技术，以帮助所有人享受更长寿、更健康的生活。

贾与Applebaum和麻省理工学院EECS教授和CSAIL首席研究员Martin Rinard一起撰写了这篇论文，他们都是该论文的资深作者。该论文的研究人员在麻省理工学院CSAIL期间得到了部分支持，得到了国防高级研究计划局，波音公司，美国国家科学基金会和Aarno实验室的支持。TriNetX为该项目提供了资源，预防癌症基金会也为该团队提供了支持。

新闻旨在传播有益信息，英文版原文来自https://news.mit.edu/2024/new-hope-early-pancreatic-cancer-intervention-ai-based-risk-prediction-0118