医疗决策的人工智能自动化

麻省理工学院的计算机科学家们希望通过自动化一个通常由手工完成的关键步骤，加快人工智能在改善医疗决策方面的应用。随着某些数据集变得越来越大，这一过程将变得越来越困难。

预测分析领域在帮助临床医生诊断和治疗病人方面有越来越大的希望。机器学习模型可以通过训练来发现患者数据中的模式，以帮助败血症治疗，设计更安全的化疗方案，并预测患者患乳腺癌或死于ICU的风险，仅举几个例子。

通常，培训数据集由许多患病和健康的受试者组成，但每个受试者的数据相对较少。然后，专家必须在数据集中找到那些对预测非常重要的方面(或“特性”)。

这种“特性工程”可能是一个费力且昂贵的过程。但随着可穿戴传感器的兴起，这项技术变得更具挑战性，因为研究人员可以更容易地长期监测患者的生物特征，比如跟踪睡眠模式、步态和语音活动。仅仅经过一周的监测，专家们就可以为每个研究对象收集到数十亿个数据样本。

本周，麻省理工学院(MIT)的研究人员在“医疗机器学习”(Machine Learning for Healthcare)大会上发表的一篇论文中，展示了一个自动学习声带疾病特征的模型。这些功能来自于大约100名受试者的数据集，每个受试者都有大约一周的语音监控数据和数十亿个样本——换句话说，每个受试者只有少量受试者，但却有大量数据。数据集包含从安装在受试者脖子上的小型加速度计传感器捕捉到的信号。

在实验中，该模型利用从这些数据中自动提取的特征，对有无声带结节的患者进行分类，准确率较高。这些病变发生在喉部，通常是由于声音滥用的模式，如大声唱歌或大喊大叫。重要的是，模型在没有大量手工标记数据的情况下完成了这项任务。

“收集长时间序列数据集变得越来越容易。但是你有医生需要运用他们的知识来标记数据集，”麻省理工学院计算机科学和人工智能实验室(CSAIL)的博士生Jose Javier Gonzalez Ortiz说。“我们想为专家们去掉手工部分，把所有的功能工程都转移到机器学习模型上。”

该模型可用于学习任何疾病或条件的模式。但是，研究人员说，在开发预防、诊断和治疗这种疾病的改进方法方面，发现与声带结节相关的日常语音使用模式的能力是一个重要的步骤。这可能包括设计新的方法来识别和提醒人们注意潜在的破坏性声音行为。

John Guttag是计算机科学和电子工程Dugald C. Jackson教授，也是CSAIL数据驱动推理小组的组长，他也加入了Gonzalez Ortiz的论文。Robert Hillman, Jarrad Van Stan, Daryush Mehta，麻省总医院喉部手术和声音康复中心;以及多伦多大学计算机科学和医学助理教授Marzyeh Ghassemi。

迫使特征学习

多年来，麻省理工学院的研究人员一直在与喉外科和语音康复中心合作，开发和分析来自传感器的数据，以跟踪受试者在所有醒着的时间里的语音使用情况。该传感器是一个加速度计，有一个节点附着在脖子上，并与智能手机相连。当人们说话时，智能手机从加速度计的位移中收集数据。

在他们的工作中，研究人员收集了104名受试者一周的数据——称为“时间序列”数据，其中一半人被诊断为声带结节。对于每一个病人，也有一个匹配的对照组，这意味着一个健康的受试者具有相似的年龄、性别、职业和其他因素。

传统上，专家需要手动识别对模型检测各种疾病或条件可能有用的特征。这有助于防止医疗保健中常见的机器学习问题:过度适应。这时，在训练中，一个模型“记忆”受试者的数据，而不是仅仅学习与临床相关的特征。在测试中，这些模型往往无法识别出之前未见过的主题中的相似模式。

“一个模型没有学习临床意义重大的特征，而是看到模式后说，‘这是萨拉，我知道萨拉很健康，这是彼得，他有一个声带结节。所以，这只是记忆实验对象的模式。然后，当它看到安德鲁(Andrew)的数据时，它无法判断这些模式是否符合分类。安德鲁有一种新的语音使用模式。

因此，主要的挑战是在自动化手动特性工程时防止过度拟合。为此，研究人员强迫模型在没有受试者信息的情况下学习特征。对于他们的任务来说，这意味着捕捉受试者说话的所有时刻以及他们声音的强度。

当他们的模型在受试者的数据中爬行时，它被编程来定位声音片段，这些片段只占数据的大约10%。对于每一个发声窗口，该模型计算一个频谱图，这是频率随时间变化的频谱的可视化表示，通常用于语音处理任务。然后，光谱图被存储为数千个值的大矩阵。

但是这些矩阵很大，很难处理。因此，自动编码器——一种优化的神经网络，从大量数据中生成高效的数据编码——首先将光谱图压缩成30个值的编码。然后它将编码解压成一个单独的光谱图。

基本上，模型必须确保解压后的谱图与原始谱图输入非常相似。在此过程中，它必须学习每个受试者的整个时间序列数据上的每个光谱图段输入的压缩表示。压缩表示是帮助训练机器学习模型做出预测的特性。

绘制正常和异常特征

在训练中，模型学会将这些特征映射到“患者”或“对照组”。“患者的发声模式将比对照组更多。在对以前从未见过的物体进行测试时，该模型同样将所有光谱图片段浓缩成一组简化的特征。然后，这是多数规则:如果受试者的声音片段大多异常，则将其归类为患者;如果他们大部分是正常的，他们被归为对照组。

在实验中，该模型与需要人工特征工程的最先进模型一样精确。重要的是，研究人员的模型在训练和测试中都表现准确，表明它是从数据中学习临床相关的模式，而不是从特定主题的信息中学习。

接下来，研究人员想要监测各种治疗方法，比如手术和声音治疗，是如何影响声音行为的。如果病人的行为随着时间的推移从异常变为正常，他们很可能会改善。他们还希望在心电图数据上使用类似的技术，用于跟踪心脏的肌肉功能。

新闻旨在传播有益信息，英文原版地址：http://news.mit.edu/2019/automating-ai-medical-decisions-0806