耶鲁大学的研究人员及其合作者报告说,一种新的测序技术和机器学习相结合,可以加快新生儿疾病的诊断,并减少假阳性结果。
血液通常在婴儿出生后不久从脚后跟的针孔中抽取,并分析一系列可预防的疾病,包括40多种罕见但可能致残和严重的代谢紊乱。血液测试是高度敏感的,而且有一个缺点——在许多情况下,当没有血液测试时,血液测试表明一种疾病。
例如,对加州新生儿数据库的回顾显示,在100名被正确识别为甲基丙二酸血症(MMA)阳性的婴儿中,有500多名被错误识别为患有这种疾病。
这项新研究的资深作者、遗传学副教授科特·沙夫(Curt Scharfe)说,这些假阳性结果可能会让家长感到非常焦虑,并在结果公布前引发一系列测试。这项新研究于9月12日发表在《遗传学在医学》(genetics in Medicine)杂志上。
“确诊前的这段时间对家庭来说压力很大,给医疗系统带来了负担,在某些情况下可能会推迟对这些婴儿的正确治疗。”Scharfe说。
通过引入一种全新的数据分析方法,研究人员能够检测整个代谢谱,从而比以前的方法进行更精确的分析,而以前的方法只关注收集到的一小部分数据。研究人员开发的新的测序方法正确地识别出89%的MMA新生儿。
该团队认为,它可以进一步提高MMA基因测序对另一种新生儿DNA测试(囊性纤维化)的敏感性。然而,“通过将测序与我们的新型机器学习相结合,我们在减少MMA假阳性结果方面取得了很大的进展,”Scharfe说。
作者说,测序和数据分析的新组合可以用来补充现有的常规血液工作,以避免冗长的检测,并加快对需要早期和额外护理的婴儿的治疗。在进一步的临床验证之后,我们的目标是通过与美国和世界各地的公共新生儿筛查(NBS)项目合作来实施新的检测方法。
耶鲁大学的研究小组包括主要作者彭刚,他是耶鲁大学遗传和生物统计学系的博士后;遗传学副研究员尼鲁·甘多特拉;以及生物统计学、遗传学、统计学和数据科学教授赵宏宇。
斯坦福大学(Stanford University)和加州大学旧金山分校(University of California-San Francisco)的研究人员也对这篇论文做出了贡献。
本研究由NIH资助R01 HD081355。