分类
加州大学伯克利分校新闻

ORF8的奇怪结构:科学家绘制了与免疫逃避和疾病严重程度相关的冠状病毒蛋白

Share37TweetRedditShare37股票

共同作者Cosmo Buffalo(左)和Richard Hooy讨论ORF8结构,显示为带状图和空间填充模型。(来源:凯文·拉森)

一个由艾滋病毒研究人员、细胞生物学家和生物物理学家组成的团队联合起来支持COVID-19科学,他们确定了一种冠状病毒蛋白的原子结构,这种蛋白被认为有助于病原体逃避和抑制人类免疫细胞的反应。该结构图现已发表在《美国国家科学院院刊》(PNAS)上,但自8月以来一直向科学界开放。该结构图为专门针对SARS-CoV-2的新型抗病毒治疗奠定了基础,并使进一步研究这种新出现的病毒是如何破坏人体的成为可能。

“使用x射线晶体学,我们建立了一个ORF8原子模型,它强调两个独特的区域:一个只出现在SARS-CoV-2及其直接蝙蝠的祖先,和一个没有任何其他冠状病毒,”主要作者詹姆斯·赫尔利说,加州大学伯克利分校教授、前教师学家劳伦斯伯克利国家实验室(伯克利实验室)。“这些区域稳定了蛋白质——这是一种分泌的蛋白质,不像病毒的特征刺突蛋白那样结合在膜上——并创造新的分子间界面。我们和研究界的其他人都认为,这些界面参与了某种反应,使SARS-CoV-2比它进化而来的毒株更具致病性。”

结构生物学在聚光灯下

Biophysicist Marc Allaire, whose work has supported numerous SARS-CoV-2 studies

Marc Allaire,摄于2020年6月,为COVID-19研究项目搭建先进光源’s晶体学光束之一。(资料来源:玛丽莲·萨金特/伯克利实验室)

生成蛋白质结构图总是需要大量的劳动,因为科学家们必须设计出能够泵出大量分子的细菌,操纵这些分子形成纯晶体,然后拍摄很多很多晶体的x射线衍射图像。这些图像是由x射线束从晶体中的原子反射回来,穿过晶格的缝隙,产生一种点状图案产生的。这些图像通过特殊的软件进行组合和分析,以确定每个原子的位置。根据蛋白质的复杂程度,这个艰苦的过程可能需要数年时间。

对许多蛋白质来说,构建图谱的过程是通过将未解分子的结构与其他已经绘制出图谱的氨基酸序列相似的蛋白质进行比较来帮助进行的,这样科学家就可以对蛋白质如何折叠成其三维形状做出有根据的猜测。

但是对于ORF8,团队必须从头开始。ORF8的氨基酸序列与其他任何蛋白质都不一样,以至于科学家们无法参考它的整体形状,而决定其功能的是蛋白质的三维形状。

【深度学习如何帮助解决蛋白质结构】

赫尔利和他在加州大学伯克利分校的同事们在HIV蛋白的结构分析方面经验丰富,他们与位于加州大学伯克利分校高级光源实验室(ALS)的结构生物学中心的生物物理学家和晶体学专家马克·阿莱尔(Marc Allaire)合作。他们一起努力工作了六个月——Hurley的实验室生成了晶体样本,并将它们交给Allaire,后者将使用ALS的x射线光束线来拍摄衍射图像。ORF8的结构是由数百个含有不同版本蛋白质的晶体和数千张衍射图像组成的,这些图像都是通过特殊的计算机算法分析得出的。

“冠状病毒的突变不同于流感或艾滋病毒等病毒,后者通过一个被称为高突变的过程快速积累许多小变化。在冠状病毒中,大块的核酸有时会通过重组四处移动,”Hurley解释说。当这种情况发生时,新的大的蛋白质区域就会出现。在SARS-CoV-2大流行早期进行的基因分析显示,这种新毒株是从感染蝙蝠的一种冠状病毒进化而来的,而且在编码一种名为ORF7的蛋白质的基因组区域发生了重大的重组突变,这种蛋白质在许多冠状病毒中都存在。ORF7的新形式被命名为ORF8,很快引起了病毒学家和流行病学家的注意,因为像ORF8这样的重大遗传差异事件往往是造成新毒株毒性的原因。

ORF8结构的带状图。这种蛋白质由两个相同的氨基酸序列和形状的单元组成,它们通过硫-硫键结合在一起。(来源:赫尔利实验室)

“基本上,这种突变导致蛋白质的大小增加了一倍,而增加一倍的物质与任何已知的折叠无关,”Hurley补充说。“其中大约一半的核心是’与早期冠状病毒已解决的结构中的一种已知折叠类型有关,但另一半是全新的。”

接电话

与许多从事COVID-19研究的科学家一样,赫尔利和他的同事选择在数据发表在同行评议的期刊上之前分享他们的发现,这使得其他人可以比传统的发表程序提前几个月开始有影响力的后续研究。正如阿莱尔所解释的那样,由大流行造成的所有人都参与其中的危机,使研究界的每个人都变成了务实的心态。科学家们不用担心谁先完成了某件事,也不用拘囿于自己的特定研究领域,他们更早、更频繁地分享数据,当他们拥有所需的资源和专业知识时,就会开始新项目。

在这种情况下,Hurley在加州大学伯克利分校的合作者有病毒蛋白质和晶体学的专业知识,而Allaire,一个长期的合作者,也有晶体学的专业知识,关键的是,光束仍然在运行。ALS获得了《护理法案》(CARES Act)的特别资助,以继续开展COVID-19调查。该团队通过回顾1月发布的SARS-CoV-2基因组分析,了解到ORF8是(当时更加模糊的)大流行之谜的重要组成部分,因此他们开始工作。

从那以后,作者们都转向了其他项目,满意地为其他小组更详细地研究ORF8奠定了基础。(目前,有几项正在进行的研究集中在ORF8如何与细胞受体相互作用以及它如何与抗体相互作用,因为感染个体除了产生针对病毒表面蛋白的抗体外,似乎还产生了与ORF8结合的抗体。)

“当我们开始这个项目的时候,其他的项目都被搁置了,而我们有了这个独特的机会来坚持下来,解决一个紧迫的问题,”Allaire说,他是伯克利实验室分子生物物理和综合生物成像部门的一员。“我们非常密切地合作,进行了很多反复,直到我们做出了正确的选择。这真的是我职业生涯中最好的合作之一。”

从层序到结构

由AlphaFold 2(蓝色)预测的ORF8结构的色带图渲染,覆盖在由加州大学伯克利分校领导的团队确定的实际结构(绿色)上。(来源:DeepMind)

氨基酸测序一个基因或一个字符串来理解蛋白质的组件是快速和容易的科学家,但研究氨基酸序列折叠成蛋白质的实际物理交互形式使用x射线晶体学或低温电子显微镜是复杂和费时。因此,在生物学领域一直有一种长期的呼声,那就是开发一种工具,根据蛋白质的序列来准确预测蛋白质的结构。

在过去的几十年里,机器学习已经成为这一挑战的领跑者。这些人工智能程序被提供已知蛋白质结构的大型数据集,以便它们学会识别序列和折叠形状之间的相关性,迅速找到人类需要数年才能发现的模式。一旦这个被称为算法的程序以这种方式“训练”,它就可以用来建立未解蛋白质结构的预测模型。每次给它喂食一个新的经过确认的结构,它就会得到改善。

为了检验哪种算法是最好的,很多公司和机构都会举办竞赛,其中最著名的是每年两次的蛋白质结构预测临界评估(Critical Assessment of protein Structure Prediction, CASP)实验。去年,ORF8被选为CASP比赛的最后一项挑战,因为它“非常难以预测”,Hurley说。最优秀的算法都是基于ORF8结构和其他结构,直到8月份这些结构被公布在蛋白质数据库中,CASP的评委们才能够选出获胜者。AlphaFold 2是谷歌分支DeepMind开发的算法,在构建了最接近实验目标(包括ORF8)的结构后,排名第一。

,

先进光源是能源部科学办公室的用户设备。伯克利结构生物学中心部分由霍华德休斯医学研究所和国家卫生研究院支持。

,

# # #

劳伦斯伯克利国家实验室(Lawrence Berkeley National Laboratory)成立于1931年,它相信最大的科学挑战是由团队来解决的。该实验室及其科学家已获得14项诺贝尔奖。今天,伯克利实验室的研究人员开发可持续能源和环境解决方案,创造有用的新材料,推进计算前沿,并探索生命、物质和宇宙的奥秘。来自世界各地的科学家依靠实验室的设备进行他们自己的发现科学。伯克利实验室是一个多项目的国家实验室,由加州大学为美国能源部科学办公室管理。

doe’的科学办公室是美国物理科学基础研究最大的单一支持者,并致力于解决我们这个时代一些最紧迫的挑战。欲了解更多信息,请访问energy.gov/science。

Share37TweetRedditShare37股票

新闻旨在传播有益信息,英文原版地址:https://newscenter.lbl.gov/2021/01/12/odd-structure-of-orf8/