分类
麻省理工学院新闻

通过基于人工智能的风险预测实现早期胰腺癌干预的新希望

Drawing of a large group of people from an aerial perspective forming a distorted oval shape. Several individuals are standing apart from the formation.

第一例记录在案的胰腺癌病例可以追溯到 18 世纪。从那时起,研究人员进行了漫长而具有挑战性的奥德赛,以了解这种难以捉摸的致命疾病。迄今为止,没有比早期干预更好的癌症治疗方法了。不幸的是,位于腹部深处的胰腺对于早期发现特别难以捉摸。

麻省理工学院计算机科学和人工智能实验室 (CSAIL) 的科学家与贝丝以色列女执事医疗中心 (BIDMC) 放射肿瘤学系的科学家 Limor Appelbaum 一起,渴望更好地识别潜在的高危患者。他们着手开发两种机器学习模型,用于早期检测胰腺导管腺癌(PDAC),这是最常见的癌症形式。为了访问广泛而多样化的数据库,该团队使用来自美国各个机构的电子健康记录数据,与一家联合网络公司同步。这个庞大的数据池有助于确保模型的可靠性和泛化性,使其适用于广泛的人群、地理位置和人口群体。

这两个模型——“棱镜”神经网络和逻辑回归模型(一种概率统计技术)优于当前的方法。该团队的比较表明,虽然标准筛查标准使用高出五倍的相对风险阈值识别出约10%的PDAC病例,但Prism可以在相同的阈值下检测到35%的PDAC病例。

使用人工智能检测癌症风险并不是一个新现象——算法可以分析乳房 X 光检查、肺癌的 CT 扫描,并协助分析巴氏涂片检查和 HPV 检测,仅举几例。麻省理工学院电气工程和计算机科学(EECS)博士生、麻省理工学院CSAIL附属机构、电子 生物医学 开放获取论文的第一作者Kai Jia说:“PRISM模型因其在超过500万患者的广泛数据库中的开发和验证而脱颖而出,超过了该领域大多数先前研究的规模概述新工作。“该模型使用常规临床和实验室数据进行预测,与其他PDAC模型相比,美国人口的多样性是一个重大进步,这些模型通常局限于特定的地理区域,如美国的一些医疗保健中心。

“这份报告概述了一种强大的方法,使用大数据和人工智能算法来完善我们识别癌症风险状况的方法,”哈佛医学院教授、癌症中心主任兼血液学和血液系统恶性肿瘤主任David Avigan说,他没有参与这项研究。“这种方法可能会导致新的策略来识别恶性肿瘤高风险患者,这些患者可能受益于具有早期干预潜力的重点筛查。

棱镜视角

PRISM的发展之旅始于六年多前,其动力来自当前诊断实践局限性的第一手经验。“大约80-85%的胰腺癌患者在晚期被诊断出来,治愈不再是一种选择,”资深作者Appelbaum说,他也是哈佛医学院的讲师和放射肿瘤学家。“这种临床上的挫败感激发了深入研究电子健康记录 (EHR) 中大量可用数据的想法。”

CSAIL小组与Appelbaum的密切合作使得能够更好地理解该问题的医学和机器学习方面,最终导致一个更加准确和透明的模型。“假设这些记录包含隐藏的线索 – 微妙的迹象和症状,可以作为胰腺癌的早期预警信号,”她补充道。“这指导了我们在开发这些模型时使用联合 EHR 网络,为在医疗保健中部署风险预测工具提供了一种可扩展的方法。”

PrismNN 和 PrismLR 模型都分析了 EHR 数据,包括患者人口统计、诊断、药物和实验室结果,以评估 PDAC 风险。PrismNN 使用人工神经网络来检测年龄、病史和实验室结果等数据特征中的复杂模式,从而生成 PDAC 可能性的风险评分。PrismLR 使用逻辑回归进行更简单的分析,根据这些特征生成 PDAC 的概率分数。总之,这些模型对从相同的 EHR 数据预测 PDAC 风险的不同方法进行了全面评估。

该团队指出,获得医生信任的一个关键点是更好地理解模型的工作原理,这在该领域被称为可解释性。科学家们指出,虽然逻辑回归模型本质上更容易解释,但最近的进展使深度神经网络在某种程度上更加透明。这有助于该团队将来自单个患者 EHR 的数千个潜在预测特征细化为大约 85 个关键指标。这些指标,包括患者年龄、糖尿病诊断和就诊频率的增加,由模型自动发现,但与医生对胰腺癌相关风险因素的理解相匹配。

前进的道路

尽管PRISM模型很有希望,但与所有研究一样,某些部分仍在进行中。仅美国数据就是这些模型的当前饮食,需要进行测试和调整以供全球使用。该团队指出,前进的道路包括扩大该模型对国际数据集的适用性,并整合其他生物标志物以进行更精细的风险评估。

“我们的后续目标是促进这些模型在常规医疗保健环境中的实施。我们的愿景是让这些模型在医疗保健系统的后台无缝运行,自动分析患者数据并提醒医生注意高风险病例,而不会增加他们的工作量,“贾说。“与 EHR 系统集成的机器学习模型可以使医生能够为高危患者提供早期警报,从而有可能在症状出现之前进行干预。我们渴望在现实世界中部署我们的技术,以帮助所有人享受更长寿、更健康的生活。

贾与Applebaum和麻省理工学院EECS教授和CSAIL首席研究员Martin Rinard一起撰写了这篇论文,他们都是该论文的资深作者。该论文的研究人员在麻省理工学院CSAIL期间得到了部分支持,得到了国防高级研究计划局,波音公司,美国国家科学基金会和Aarno实验室的支持。TriNetX为该项目提供了资源,预防癌症基金会也为该团队提供了支持。

新闻旨在传播有益信息,英文版原文来自https://news.mit.edu/2024/new-hope-early-pancreatic-cancer-intervention-ai-based-risk-prediction-0118