分类
麻省理工学院新闻

将细胞工程化为新状态的更有效的实验设计

Two orbs resembling eyeballs are connected as they pull apart upon cosmic background.

Portrait of Caroline Uhler

细胞重编程策略涉及使用靶向遗传干预将细胞设计成新状态。例如,该技术在免疫疗法中具有很大的前景,研究人员可以重新编程患者的T细胞,使它们成为更有效的癌症杀手。有朝一日,这种方法还可以帮助确定挽救生命的癌症治疗方法或修复疾病肆虐器官的再生疗法。

但是人体有大约20,000个基因,遗传扰动可能是基因的组合或调节基因的1,000多种转录因子中的任何一种。由于搜索空间广阔,基因实验成本高昂,科学家们往往难以为其特定应用找到理想的扰动。

麻省理工学院哈佛大学的研究人员开发了一种新的计算方法,可以基于比传统方法少得多的实验次数有效地识别最佳遗传扰动。

他们的算法技术利用复杂系统中因素之间的因果关系,例如基因组调控,在每一轮连续实验中优先考虑最佳干预。

研究人员进行了严格的理论分析,以确定他们的技术确实确定了最佳干预措施。有了这个理论框架,他们将算法应用于旨在模拟细胞重编程实验的真实生物数据。他们的算法是最高效和最有效的。

“很多时候,大规模的实验都是凭经验设计的。顺序实验的仔细因果框架可能允许以更少的试验确定最佳干预措施,从而降低实验成本,“共同资深作者Caroline Uhler说,他是电气工程和计算机科学系(EECS)的教授,也是麻省理工学院和哈佛大学布罗德研究所埃里克和温迪施密特中心的联合主任,也是麻省理工学院信息和决策系统实验室(LIDS)和数据研究所的研究员, 系统与社会。

与Uhler一起发表在今天发表在 Nature Machine Intelligence上的论文的是主要作者Jiaqi Zhang,研究生和Eric和Wendy Schmidt中心研究员;共同资深作者Themistoklis P. Sapsis,麻省理工学院机械和海洋工程教授,IDSS成员;以及哈佛和麻省理工学院的其他人。

主动学习

当科学家试图为复杂系统设计有效的干预措施时,例如细胞重编程,他们通常会按顺序进行实验。此类设置非常适合使用称为主动学习的机器学习方法。收集数据样本并用于学习包含迄今为止收集的知识的系统模型。从这个模型中,设计了一个采集函数——一个评估所有潜在干预措施并选择最佳干预措施在下一次试验中测试的方程式。

重复此过程,直到确定最佳干预措施(或资助后续实验的资源用完)。

“虽然有几个通用的采集函数可以顺序设计实验,但这些函数对如此复杂的问题无效,导致收敛非常慢,”Sapsis解释说。

获取函数通常考虑因素之间的相关性,例如哪些基因共表达。但只关注相关性忽略了系统的监管关系或因果结构。例如,遗传干预只能影响下游基因的表达,但基于相关性的方法将无法区分上游或下游的基因。

“你可以从数据中学习一些因果知识,并用它来更有效地设计干预措施,”张解释说。

麻省理工学院和哈佛大学的研究人员利用这种潜在的因果结构进行他们的技术。首先,他们精心构建了一个算法,因此它只能学习解释因果关系的系统模型。

然后,研究人员设计了获取功能,以便它使用有关这些因果关系的信息自动评估干预措施。他们精心设计了这个功能,以便它优先考虑信息量最大的干预措施,这意味着那些最有可能在随后的实验中导致最佳干预的干预措施。

“通过考虑因果模型而不是基于相关性的模型,我们已经可以排除某些干预措施。然后,每当你获得新数据时,你都可以学习更准确的因果模型,从而进一步缩小干预的空间,“Uhler解释说。

这种较小的搜索空间,加上采集功能对信息量最大的干预措施的特别关注,使他们的方法如此高效。

研究人员使用一种称为输出加权的技术进一步改进了他们的采集功能,该技术的灵感来自对复杂系统中极端事件的研究。这种方法仔细强调可能更接近最佳干预措施的干预措施。

“从本质上讲,我们认为最佳干预是所有可能的次优干预空间内的’极端事件’,并使用我们为这些问题开发的一些想法,”Sapsis说。

提高效率

他们在模拟细胞重编程实验中使用真实的生物数据测试了他们的算法。对于这项测试,他们寻求一种遗传扰动,这将导致平均基因表达的预期变化。他们的采集功能通过多阶段实验的每一步始终确定比基线方法更好的干预措施。

“如果你在任何阶段切断实验,我们的实验仍然会比基线更有效率。这意味着你可以运行更少的实验并获得相同或更好的结果,“张说。

研究人员目前正在与实验学家合作,将他们的技术应用于实验室中的细胞重编程。

他们的方法也可以应用于基因组学以外的问题,例如确定消费品的最佳价格或在流体力学应用中实现最佳反馈控制。

将来,他们计划增强他们的优化技术,超越那些寻求匹配所需平均值的技术。此外,他们的方法假设科学家已经了解了他们系统中的因果关系,但未来的工作也可以探索如何使用人工智能来学习这些信息。

这项工作部分由海军研究办公室,麻省理工学院-IBM沃森人工智能实验室,麻省理工学院J-Clinic机器学习与健康,布罗德研究所的埃里克和温迪施密特中心,西蒙斯研究员奖,空军科学研究办公室和国家科学基金会研究生奖学金资助。

新闻旨在传播有益信息,英文版原文来自https://news.mit.edu/2023/more-effective-experimental-design-genome-regulation-1002