分类
芝加哥大学新闻

芝加哥大学的科学家使用机器学习将细胞快照动态化

Cancer cells

想象一下,从比赛开始 10 秒拍摄的静态照片中预测肯塔基赛马会的确切完赛顺序。

与研究人员在试图研究胚胎如何发育、细胞分化、癌症形成和免疫系统反应时所面临的情况相比,这一挑战相形见绌——所有这些都使用显微镜或基因组测序的快照。

但在4月26日发表在《 美国国家科学院院刊》(Proceedings of the National Academy of Sciences)上的一篇论文中,芝加哥大学普利兹克分子工程学院(UChicago Pritzker School of Molecular Engineering)和化学系的研究人员公布了一种强大的新方法,即利用单细胞RNA测序的静态快照来研究细胞和基因如何随时间变化。

为了开发他们称之为TopicVelo的方法,该团队采用了一种跨学科的方法,结合了经典机器学习以及计算生物学和化学的概念。

“在无监督机器学习方面,我们使用了一个非常简单、成熟的想法。就我们使用的转录模型而言,这也是一个非常简单、古老的想法。但是当你把它们放在一起时,它们会做一些比你想象的更强大的事情,“PME分子工程和医学助理教授Samantha Riesenfeld说,他与化学系教授Suriyanarayanan Vaikuntanathan和他们的共同学生,芝加哥大学化学博士生Cheng Frank Gao一起撰写了这篇论文。

伪时间的麻烦

在试图了解体内的复杂过程时,研究人员经常使用单细胞RNA测序(scRNA-seq)来获得强大而详细的测量结果,但本质上是静态的。

Riesenfeld解释说,问题在于,“单细胞RNA测序是破坏性的。当你以这种方式测量细胞时,你就破坏了细胞。

这给研究人员留下了细胞被测量/破坏的那一刻的快照。然而,许多研究人员需要的信息是细胞 如何随时间转变。他们需要 知道细胞是如何 癌变的,或者特定基因程序在免疫反应期间的行为。

为了帮助从静态快照中找出动态过程,研究人员传统上使用所谓的“伪时间”。当捕获图像时,它还捕获了相同类型的其他细胞和基因,这些细胞和基因可能在同一过程中更进一步。如果科学家们正确地连接了这些点,他们就可以深入了解这个过程随着时间的推移会是什么样子。

然而,连接这些点是困难的猜测,基于这样的假设,即外观相似的细胞只是在同一路径上的不同点上 – 生物学通常要复杂得多,错误的开始,停止,爆发和多种化学力拉扯每个基因。

与传统的伪时间方法不同,科学家们对一种称为“RNA速度”的替代方法感兴趣,该方法着眼于这些细胞内mRNA的转录,剪接和降解的动力学。这是很有前途的,但仍然是早期技术。

为了改进RNA速度方法,TopicVelo采用了一种更困难的随机模型,并从中收集见解,该模型反映了生物学不可避免的随机性。

“当你想到细胞时,它们本质上是随机的,”该论文的第一作者Gao说。“你可以有双胞胎或基因相同的细胞,它们长大后会变得非常不同。TopicVelo 介绍了随机模型的使用。我们能够更好地捕捉转录过程中的潜在生物物理学,这对mRNA转录很重要。

机器学习指明了方向

研究小组还意识到,另一个假设限制了标准RNA的速度。“大多数方法假设所有细胞基本上都在表达相同的大基因程序,但你可以想象细胞必须同时在不同程度上做不同类型的过程,”Riesenfeld说。解开这些过程是一个挑战。

概率主题建模是一种传统上用于从书面文档中识别主题的机器学习工具,为芝加哥大学团队提供了一种策略。

TopicVelo 不是按细胞或基因的类型对 scRNA-seq 数据进行分组,而是按这些细胞和基因参与的过程进行分组。这些过程是从数据中推断出来的,而不是由外部知识强加的。

“如果你看一本科学杂志,它会按照’物理’、’化学’和’天体物理学’等主题进行组织,”高说。“我们将这种组织原理应用于单细胞RNA测序数据。所以现在,我们可以按主题组织我们的数据,如“核糖体合成”、“分化”、“免疫反应”和“细胞周期”。我们可以拟合特定于每个过程的随机转录模型。

在 TopicVelo 解开这些过程并按主题组织它们之后,它将主题权重应用回细胞上,以解释每个细胞的转录谱参与哪些活动的百分比。

根据Riesenfeld的说法,“这种方法有助于我们观察不同过程的动态,并了解它们在不同细胞中的重要性。当存在分支点时,或者当单元格被拉向不同方向时,这尤其有用。

将随机模型与主题模型相结合的结果是惊人的。例如,TopicVelo能够重建以前需要特殊实验技术才能恢复的轨迹。这些改进极大地拓宽了潜在的应用范围。

Gao将论文的发现与论文本身进行了比较,后者是许多研究领域和专业知识的产物。

“在PME,如果你有一个化学项目,很可能有一个物理或工程专业的学生在做这件事,”他说。“这从来都不仅仅是化学反应。”

引文:“复杂系统的突发转录动力学的剖析和整合”,Gao 等人,《美国国家科学院院刊》,2024 年 4 月 26 日。DOI: 10.1073/pnas.2306901121

资金来源:美国国立卫生研究院。

——改编自 普利兹克分子工程学院发表的一篇文章

新闻旨在传播有益信息,英文版原文来自https://news.uchicago.edu/story/uchicago-scientists-use-machine-learning-turn-cell-snapshots-dynamic