新的人工智能方法捕捉医学图像中的不确定性

Two hands inspect a lung X-ray. One hand is illustrated with nodes and lines creating a neural network. The other is a doctor’s hand. Four “alert” icons appear on the lung X-ray.

在生物医学中，分割涉及从医学图像中的重要结构（如器官或细胞）注释像素。人工智能模型可以通过突出显示可能显示某种疾病或异常迹象的像素来帮助临床医生。

然而，这些模型通常只提供一个答案，而医学图像分割的问题往往远非非黑即白。五位专家人类注释者可能会提供五种不同的分割，可能不同意肺部 CT 图像中结节边界的存在或范围。

“有选择权可以帮助做出决策。即使只是看到医学图像中的不确定性也会影响某人的决定，因此将这种不确定性考虑在内非常重要，“麻省理工学院计算机科学博士候选人Marianne Rakic说。

Rakic是麻省理工学院、麻省理工学院和哈佛大学布罗德研究所以及马萨诸塞州总医院的其他人共同撰写的一篇论文的主要作者，该论文介绍了一种新的人工智能工具，可以捕捉医学图像中的不确定性。

该系统被称为Tyche（以希腊的偶然神性命名），它提供了多个合理的分段，每个分段都突出显示了医学图像的略微不同的区域。用户可以指定 Tyche 输出的选项数量，并选择最适合其目的的选项。

重要的是，Tyche 可以处理新的分段任务，而无需重新培训。训练是一个数据密集型过程，涉及向模型展示许多示例，并且需要丰富的机器学习经验。

因为它不需要再培训，所以临床医生和生物医学研究人员可能比其他一些方法更容易使用Tyche。它可以“开箱即用”地应用于各种任务，从识别肺部X射线中的病变到精确定位脑部MRI中的异常。

最终，该系统可以通过引起人们对其他人工智能工具可能遗漏的潜在关键信息的关注来改善诊断或帮助生物医学研究。

“模棱两可的研究不足。如果你的模型完全错过了三位专家说有的结节，而两位专家说没有，这可能是你应该注意的事情，“资深作者Adrian Dalca补充道，他是哈佛医学院和MGH的助理教授，也是麻省理工学院计算机科学和人工智能实验室（CSAIL）的研究科学家。

他们的合著者包括电气工程和计算机科学研究生Hallee Wong;何塞·哈维尔·冈萨雷斯·奥尔蒂斯（Jose Javier Gonzalez Ortiz）博士，23岁;贝丝·西米尼（Beth Cimini），布罗德研究所生物图像分析副主任;以及 Dugald C. Jackson 计算机科学和电气工程教授 John Guttag。Rakic 将在 IEEE 计算机视觉和模式识别会议上展示 Tyche，Tyche 被选为亮点。

解决歧义问题

用于医学图像分割的 AI 系统通常使用神经网络。神经网络松散地基于人脑，是机器学习模型，由许多相互连接的节点或神经元层组成，用于处理数据。

在与使用这些系统的布罗德研究所和MGH的合作者交谈后，研究人员意识到两个主要问题限制了它们的有效性。这些模型无法捕获不确定性，即使对分割任务略有不同，也必须对其进行重新训练。

Rakic说，有些方法试图克服一个陷阱，但事实证明，用一个解决方案解决这两个问题特别棘手。

“如果你想考虑歧义，你通常必须使用一个极其复杂的模型。通过我们提出的方法，我们的目标是使其易于与相对较小的模型一起使用，以便它可以快速做出预测，“她说。

研究人员通过修改一个简单的神经网络架构来构建Tyche。

用户首先向 Tyche 提供一些显示分段任务的示例。例如，示例可能包括心脏 MRI 中的几张病变图像，这些图像已由不同的人类专家分割，以便模型可以学习任务并查看是否存在歧义。

研究人员发现，只有16张示例图像（称为“上下文集”）就足以让模型做出良好的预测，但可以使用的示例数量没有限制。上下文集使 Tyche 无需重新训练即可解决新任务。

为了让Tyche捕捉不确定性，研究人员修改了神经网络，使其根据一个医学图像输入和上下文集输出多个预测。他们调整了网络的层，以便当数据从一层移动到另一层时，在每一步生成的候选分段可以相互“对话”，并与上下文集中的示例“对话”。

通过这种方式，该模型可以确保候选细分都略有不同，但仍能解决任务。

“这就像掷骰子。如果你的模型可以滚动两个、三个或四个，但不知道你已经有两个和四个，那么任何一个都可能再次出现，“她说。

他们还修改了训练过程，以便通过最大限度地提高最佳预测的质量来获得奖励。

如果用户要求五个预测，最后他们可以看到 Tyche 生成的所有五个医学图像分割，即使一个可能比其他更好。

研究人员还开发了一种Tyche版本，该版本可以与现有的预训练模型一起使用，用于医学图像分割。在本例中，Tyche 通过对图像进行轻微变换，使模型能够输出多个候选者。

更好、更快的预测

当研究人员用带注释的医学图像数据集测试Tyche时，他们发现它的预测捕捉到了人类注释者的多样性，并且其最佳预测比基线模型中的任何预测都要好。Tyche 的性能也比大多数型号快。

“输出多个候选人并确保他们彼此不同确实会给你带来优势，”Rakic 说。

研究人员还发现，Tyche 可以胜过使用大型专业数据集训练的更复杂的模型。

对于未来的工作，他们计划尝试使用更灵活的上下文集，可能包括文本或多种类型的图像。此外，他们希望探索可以改善 Tyche 最差预测的方法，并增强系统，以便它可以推荐最佳的细分候选者。

这项研究部分由美国国立卫生研究院、麻省理工学院和哈佛大学布罗德研究所的埃里克和温迪施密特中心以及广达计算机资助。

新闻旨在传播有益信息，英文版原文来自https://news.mit.edu/2024/new-ai-method-captures-uncertainty-medical-images-0411