分类
麻省理工学院新闻

简化药物发现的更智能方法

Close-up of molecule in front of other molecules

使用人工智能来简化药物发现正在爆炸式增长。研究人员正在部署机器学习模型,以帮助他们在数十亿种选择中识别分子,这些分子可能具有他们正在寻求开发新药的特性。

但是,需要考虑的变量太多了——从材料价格到出错的风险——以至于即使科学家使用人工智能,权衡合成最佳候选药物的成本也不是一件容易的事。

确定要测试的最佳和最具成本效益的分子所涉及的无数挑战是新药开发需要很长时间的原因之一,也是处方药价格高昂的关键驱动因素。

为了帮助科学家做出具有成本意识的选择,麻省理工学院的研究人员开发了一个算法框架来自动识别最佳分子候选者,从而最大限度地降低合成成本,同时最大限度地提高候选分子具有所需特性的可能性。该算法还确定了合成这些分子所需的材料和实验步骤。

他们的定量框架被称为合成计划和基于奖励的路线优化工作流程(SPARROW),考虑了一次合成一批分子的成本,因为通常可以从一些相同的化合物中衍生出多个候选分子。

此外,这种统一的方法从在线存储库和广泛使用的人工智能工具中捕获有关分子设计、特性预测和合成计划的关键信息。

除了帮助制药公司更有效地发现新药外,SPARROW还可用于发明新的农用化学品或发现有机电子专用材料等应用。

“目前,化合物的选择在很大程度上是一门艺术,有时它是一门非常成功的艺术。但是,由于我们拥有所有这些其他模型和预测工具,可以为我们提供有关分子如何表现以及它们如何合成的信息,我们可以而且应该使用这些信息来指导我们做出的决策,“麻省理工学院化学工程系、电气工程系和计算机科学系 1957 届职业发展助理教授 Connor Coley 说。 以及一篇关于SPARROW的论文的资深作者。

Coley与主要作者Jenna Fromer SM ’24一起参与了该论文。这项研究今天发表在 《自然计算科学》杂志上。

复杂的成本注意事项

从某种意义上说,科学家是否应该合成和测试某种分子,归根结底是合成成本与实验价值的问题。然而,确定成本或价值本身就是一个棘手的问题。

例如,实验可能需要昂贵的材料,或者失败的风险很高。在价值方面,人们可能会考虑了解这种分子的性质有多大用处,或者这些预测是否具有高度的不确定性。

同时,制药公司越来越多地使用间歇式合成来提高效率。他们不是一次测试一个分子,而是使用化学构建块的组合来一次测试多个候选分子。然而,这意味着化学反应都必须需要相同的实验条件。这使得估算成本和价值更具挑战性。

SPARROW通过考虑合成分子所涉及的共享中间化合物,并将该信息纳入其成本与价值函数中来应对这一挑战。

“当你考虑设计一批分子的优化游戏时,添加新结构的成本取决于你已经选择的分子,”Coley说。

该框架还考虑了起始材料的成本、每条合成路线中涉及的反应数量以及这些反应在第一次尝试中成功的可能性等因素。

为了利用SPARROW,科学家提供了一组他们正在考虑测试的分子化合物,以及他们希望发现的特性的定义。

从那里,SPARROW收集有关分子及其合成途径的信息,然后权衡每个分子的价值与合成一批候选分子的成本。它会自动选择符合用户标准的最佳候选化合物子集,并为这些化合物找到最具成本效益的合成路线。

“它只需一步即可完成所有这些优化,因此它可以真正同时捕获所有这些相互竞争的目标,”Fromer 说。

多功能框架

SPARROW是独一无二的,因为它可以结合人类手工设计的分子结构,虚拟目录中存在的分子结构,或者生成式AI模型发明的从未见过的分子。

“我们有所有这些不同的想法来源。SPARROW的部分吸引力在于,你可以把所有这些想法放在一个公平的竞争环境中,“Coley补充道。

研究人员通过在三个案例研究中应用SPARROW来评估SPARROW。这些案例研究基于化学家面临的现实问题,旨在测试SPARROW在处理各种输入分子时找到具有成本效益的合成方案的能力。

他们发现SPARROW有效地捕获了间歇合成的边际成本,并确定了常见的实验步骤和中间化学品。此外,它可以扩大规模以处理数百种潜在的候选分子。

“例如,在化学机器学习领域,有很多模型可以很好地用于逆合成或分子特性预测,但是我们实际上如何使用它们呢?我们的框架旨在发挥这项先前工作的价值。通过创建SPARROW,希望我们可以指导其他研究人员使用他们自己的成本和效用函数来思考化合物下选择,“Fromer说。

未来,研究人员希望将额外的复杂性纳入SPARROW。例如,他们希望使算法能够考虑测试一种化合物的值可能并不总是恒定的。他们还希望在其成本与价值函数中加入更多平行化学元素。

“Fromer 和 Coley 的工作更好地将算法决策与化学合成的实际情况相结合。当使用现有的计算设计算法时,确定如何最好地合成设计集的工作留给了药物化学家,导致药物化学家的选择和额外的工作,“Relay Therapeutics人工智能高级副总裁Patrick Riley说,他没有参与这项研究。“这篇论文展示了一条原则性的道路,包括对联合综合的考虑,我希望这将导致更高质量和更被接受的算法设计。

“确定要合成的化合物,既要仔细平衡时间、成本和实现目标的潜力,又要提供有用的新信息,这是药物发现团队最具挑战性的任务之一。Fromer 和 Coley 的 SPARROW 方法以有效和自动化的方式做到这一点,为人类药物化学团队提供了有用的工具,并朝着完全自主的药物发现方法迈出了重要一步,“纪念斯隆凯特琳癌症中心的计算化学家 John Chodera 补充道,他没有参与这项工作。

这项研究在一定程度上得到了DARPA加速分子发现计划,海军研究办公室和国家科学基金会的支持。

新闻旨在传播有益信息,英文版原文来自https://news.mit.edu/2024/smarter-way-streamline-drug-discovery-0617