分类
麻省理工学院新闻

将RNA带入基因组学

编码联合体鉴定参与调控基因表达的RNA序列。

人类基因组包含大约20,000个编码蛋白质的基因,但我们基因的编码部分只占整个基因组的2%左右。在过去的20年里,科学家们一直在试图找出剩下的98%在做什么。

研究财团称为编码(百科全书的DNA元素)已经取得了重大进展,目标,识别许多基因组位置结合调节蛋白,有助于控制哪些基因被开启或关闭。在一项新的研究中,也是编码的一部分,研究人员已经确定了许多额外的网站代码的RNA分子可能会影响基因的表达。

这些RNA序列不会被翻译成蛋白质,而是以各种方式起作用,控制蛋白质编码基因产生多少蛋白质。这个研究团队,包括来自麻省理工学院和其他几个机构的科学家,利用rna结合蛋白帮助他们定位和分配数以万计的基因组序列可能的功能。

“这是第一次使用多种不同技术对rna结合蛋白进行大规模功能性基因组分析,”麻省理工学院生物学教授克里斯托弗·伯奇说。“随着研究RNA结合蛋白的技术已经接近研究dna结合蛋白的水平,我们希望将RNA功能更全面地带入基因组世界。”

Burge是这项研究的资深作者之一,另外两位作者分别是加州大学圣地亚哥分校的Fu xiangdong和Gene Yeo,蒙特利尔大学的Eric Lecuyer和康涅狄格大学健康中心的Brenton Graveley。

这项研究发表在今天的《自然》杂志上,其主要作者是Peter Freese,他最近获得了麻省理工学院计算和系统生物学博士学位;加州大学圣地亚哥分校的埃里克·范·诺斯特兰德、加布里埃尔·普拉特和萧睿;蒙特利尔大学的王晓凤;还有康州大学健康中心的魏欣涛。

RNA调控

到目前为止,“编码”计划的大部分工作都依赖于使用一种名为ChIP-seq的技术来检测DNA的调控序列。这项技术使研究人员能够识别与DNA结合蛋白(如转录因子)结合的DNA位点,帮助确定这些DNA序列的功能。

然而,Burge指出,这项技术并不能检测到在参与基因调控之前必须被复制成RNA的基因组元素。相反,RNA团队依靠一种被称为eCLIP的技术,它利用紫外光在细胞内交联RNA分子和RNA结合蛋白(RBPs)。然后,研究人员利用抗体分离出特异的RBPs,并对其结合的rna进行测序。

RBPs有许多不同的功能——有些是剪接因子,可以帮助切断蛋白质编码信使RNA的部分,而另一些则可以终止转录、增强蛋白质翻译、在翻译后分解RNA,或者引导RNA到达细胞中的特定位置。确定与RBPs结合的RNA序列有助于揭示这些RNA分子的功能信息。

“RBP结合位点是转录组中的候选功能元件,”Burge说。“然而,并不是所有的结合位点都有功能,所以你需要补充其他类型的检测来评估功能。”

研究人员对大约150个RBPs进行了eCLIP,并将这些结果与另一组实验的数据进行了整合。在另一组实验中,他们在人类细胞中一次抑制大约260个RBPs的表达。然后他们测量了这种敲除对与蛋白质相互作用的RNA分子的影响。

利用Burge实验室开发的一项技术,研究人员还能够更精确地缩小RBPs与RNA结合的范围。这种技术被称为RNA结合- n – seq,可以揭示非常短的序列,有时包含RBPs所结合的凸起或发夹等结构基序。

总的来说,研究人员能够研究1500种已知人类RBPs中的350种,使用每种蛋白质一种或多种这种技术。RNA剪接因子通常有不同的活性取决于它们在转录本中的结合位置,例如,当它们结合在内含子的一端时激活剪接,当它们结合在另一端时抑制剪接。结合来自这些技术的数据,研究人员可以制作一个地图“图集”,描述每个RBP的活性如何依赖于它的结合位置。

“为什么它们在一个地方激活,而在另一个地方抑制,这一直是个谜,”Burge说。“但有了这组图谱,研究人员可能就能找出与每种活动模式相关的蛋白质特征。”

此外,Lecuyer在蒙特利尔大学的研究小组使用绿色荧光蛋白标记超过300个RBPs,并确定它们在细胞内的位置,如细胞核、细胞质或线粒体。这些位置信息也可以帮助科学家了解更多关于每个RBP及其结合的RNA的功能。

“这个手稿的力量全面、多层次的数据集的生成,可以使用生物医学社会发展疗法针对特定网站使用基因编辑策略,在基因组或转录组使用反义寡核苷酸或代理调解RNA干扰,”吉尔Ast说人类分子遗传学和生物化学教授特拉维夫大学,他并没有参与这项研究。

将RNA与疾病联系起来

世界各地的许多研究实验室现在都在利用这些数据,试图发现一些已识别的RNA序列与人类疾病之间的联系。对于许多疾病,研究人员已经识别出一种称为单核苷酸多态性(SNPs)的遗传变异,这种变异在某一特定疾病患者中更为常见。

“如果这些发生在蛋白质编码区,你可以预测对蛋白质结构和功能的影响,这一直都在进行。但如果它们发生在非编码区域,就很难弄清楚它们可能在做什么,”Burge说。“如果它们击中了我们确定与RBP结合的非编码区域,并破坏了RBP的基序,那么我们就可以预测SNP可能会改变基因的剪接或稳定性。”

Burge和他的同事们现在计划使用基于rna的技术来获取更多的rna结合蛋白的数据。

他说:“这项工作为人类遗传学社区提供了一种资源,可以用来帮助识别在RNA水平上发挥作用的遗传变异。”

这项研究是由国家人类基因组研究所编码项目和魁北克研究基金会资助的。

新闻旨在传播有益信息,英文原版地址:http://news.mit.edu/2020/bringing-rna-genomics-0729