分类
哈佛大学新闻

合作产生最完整的癌症基因图谱合作产生最完整的癌症基因图谱评估除草剂的隐藏风险评估除草剂的隐藏风险

一个国际团队完成了对整个癌症基因组最全面的研究,极大地提高了对癌症的基本认识,并为发展诊断和治疗指明了新的方向。

这些发现今天发表在《自然》杂志及其附属期刊的23篇论文中,是向绘制基因组中所有主要致癌突变图谱迈出的重要一步。

由来自37个国家的1300多名科学家和临床医生参与的ICGC/TCGA全基因组癌症分析项目(PCAWG或Pan-Cancer项目)分析了38种不同肿瘤类型的2600多个全基因组,这是癌症基因组学领域最大的公开全基因组数据集。麻省理工学院布罗德研究所(Broad Institute of MIT)和哈佛大学(Harvard)的52名成员在历时6年的项目中对这项研究做出了贡献。

利用收集到的数据,16个工作组检查了癌症发展、因果关系、进展和分类的多个方面,确认了以前的发现并产生了关于癌症生物学的新知识,包括确定了产生致癌突变的大量分子过程的多样性。泛癌症项目还改进和发展了分析癌症基因组的新方法。

以前的癌症基因组研究主要关注1%的编码蛋白质的基因组,即外显子组。这个泛癌症项目探索了剩余99%的基因组,其中包括调节基因活动的区域。

“这大型国际努力显示类型的研究的广度和新生物的见解可能使用整个癌症基因组数据,“迦得斯坦利说,协会成员和癌症基因组计算分析小组的主任Broad研究所主任也是生物信息学在麻省总医院(MGH)癌症中心和哈佛医学院病理学教授(HMS)。Getz是PCAWG指导委员会的成员,也是其中三篇论文的共同高级作者。

参与该项目指导委员会的其他机构包括加拿大的安大略癌症研究所、英国的韦康·桑格研究所、德国的欧洲分子生物学实验室和加州大学圣克鲁兹分校

“这是振奋人心的,这非常大的集团能够汇集不同的资源和努力想出一些突破性的发现,“说Rameen Beroukhim,助理Broad研究所的成员,dana – farber癌症研究所副教授,医学副教授HMS和文章的第二作者的两个文件。

开车的是谁?

今天发表的这组论文包括《自然》杂志上的一篇综述,描述了合作者如何整理和标准化来自该联盟在世界各地的数百个研究小组的现有基因组数据。将这些以前完全不同的数据集转移到一个通用的云计算平台上是该项目成功的主要部分。论文还详细介绍了该协会的一些最引人注目的发现。

例如,在这项研究中,每个肿瘤基因组平均携带4到5个“驱动突变”,这些突变在推动癌症生长方面发挥着重要作用。

在这些研究之前,30%的肿瘤有无法解释的遗传原因,但通过分析整个肿瘤基因组,该联盟的科学家发现了更多的驱动突变,只有5%的肿瘤没有已知的驱动。

Getz和其他PCAWG指导委员会成员是该综述论文的资深作者。

驾驶但不编码

另一篇发表在《自然》(Nature)杂志上的论文更密切地关注基因组中不编码蛋白质的区域的驱动突变。科学家们惊讶地发现,这些非编码驱动因素如此之少,因为99%的基因组都是非编码的。研究小组发现,在这项分析中,只有13%的司机没有编码。

“当人们开始对整个基因组测序时,我们曾期望发现非编码驱动与蛋白编码驱动的顺序相同。布罗德研究所(Broad Institute)的副研究员、《非编码驱动因素》(non-coding drivers)论文的第一作者之一、哈佛大学医学院(HMS)和MGH癌症中心(MGH Cancer Center)的医学助理教授埃丝特·莱因贝(Esther Rheinbay)说:“我们发现的数据没有我们预期的那么多,这有点令人惊讶。”前Beroukhim实验室成员Jeremiah Wala和Ofer Shapira也是共同第一作者,Getz和Beroukhim是这项研究的资深共同作者。

虽然非编码驱动程序在癌症中的作用可能比之前认为的要小,但它们也可能相对少见,而且更难找到,这意味着对这些驱动程序的搜索还没有结束。

“这些研究强调的一个问题是,我们仍然没有足够的癌症基因组数据,”Rheinbay说。“我们需要更多的癌症全基因组序列——由于DNA测序成本的降低,这将在不久的将来实现。”

Getz补充说,了解这些非编码的驱动因素在基因组中的位置——主要是在调控区域——将有助于今后对这些区域的研究。他说:“如果我们把研究范围缩小到足够小的范围,我们就有可能产生成本效益高的化验方法,使我们能够以更低的成本研究更多的肿瘤样本。”

随着时间的推移,肿瘤

另一篇发表在《自然》(Nature)杂志上的论文追踪了特定肿瘤随时间的发展,并追踪了基因变化的进程。科学家们发现,同一癌症类型的肿瘤通常具有相同的致癌突变。但随着肿瘤的发展,它们获得了额外的独特的驱动突变,这些突变是由不同的dna损伤过程引起的,具体取决于癌症类型、患者的基因和生活方式。

“使用计算重建方法,我们能够估计遗传事件的顺序和时间,导致癌症,”说Ignaty Leshchiner, co-first作者的研究中,谁是组长Broad研究所和斯坦利的实验室的成员。“我们发现,这些基因事件经常发生许多年之前检测到肿瘤。”

这项研究表明,由于早期突变在癌症类型中通常是一致的,它们可以成为预防、早期检测和治疗疾病的目标。Getz和Beroukhim是这篇论文的共同作者,英国弗朗西斯克里克研究所的Peter Van Loo和欧洲生物信息学研究所的Moritz ger是这篇论文的通讯作者。

变异的来源

在《自然》杂志的另一项研究中,研究人员研究了导致癌症突变的分子过程,包括那些破坏DNA的分子过程,以及那些破坏后无法正常修复DNA的分子过程。众所周知,这些过程会在整个基因组中产生不同的癌症突变模式或特征。通过观察这些“突变信号”,科学家可以识别出导致这些突变的分子事件。

研究小组使用数学模型分析了数千个癌症基因组中的数百万个突变,以寻找这些特征。科学家们发现了比以前更多的信息,并发现了新特征和特定的dna损伤过程之间的紧密联系。

“通过分析迄今为止所研究的最大的癌症全基因组,我们创建了迄今为止最全面的突变特征目录,”Getz说。“这个目录可以用来了解每个病人产生突变和引发癌症的机制。”

Getz是这项研究的高级合著者,他与新加坡杜克大学-新加坡国立大学医学院的Steven Rozen和韦康桑格研究所的Michael Stratton一起合作。来自Getz实验室的Jaegil Kim和Nicholas Haradhvala是论文的共同第一作者。

“由于每个人一生中都会接触到多种突变源,我们需要使用数学技术来识别哪些突变来自特定的生物源,”” Kim说。“有了这么大的数据集,我们可以更精确地绘制出这些签名。”

作者还研究了新的突变类型。Haradhvala说:“DNA可以通过多种方式发生突变,从改变单个碱基到移除整个遗传密码。”“这个新的数据集让我们能够分析更多类型的突变,扩展了我们对癌症生物学机制的理解。”

这项研究的结果将使其他研究人员能够在新测序的患者样本中确定癌症突变的来源。

展望未来

该项目为癌症基因组研究人员创建并提供了一个全面的资源,包括原始基因组测序数据、癌症基因组分析软件和探索泛癌症项目数据各个方面的多个交互式网站。

“这个全球泛癌症项目表明,我们可以从研究整个癌症基因组中学到很多东西,”Getz说。“在未来,我们将继续从更大的基因组数据集中学习癌症生物学和临床应用。”

他补充说,今天23篇论文中报道的数据、发现和方法将帮助研究人员和临床医生标准化癌症基因组分析,因为降低测序成本使更多的肿瘤基因组测序成为可能。

Getz说:“我们希望这些论文能够成为分析整个癌症基因组的标准。”

这些研究还朝着为每位癌症患者提供个性化治疗迈出了重要一步,因为它们更接近一份全面的致癌突变清单,肿瘤学家有朝一日可以利用这份清单来确定癌症患者的病因。

Getz说:“我希望能达到这样一个阶段,即对每一个来找医生看病的癌症患者,我们都能弄清楚究竟是什么在驱动肿瘤,以及我们如何治疗它。”

PCAWG是国际癌症基因组联盟(ICGC)与癌症基因组图谱(TCGA)的合作项目。ICGC是发起和协调癌症基因组研究项目的伞型组织,TCGA是由美国国家癌症研究所和美国国家人类基因组研究所共同管理的癌症基因组计划。

新闻旨在传播有益信息,英文原版地址:https://news.harvard.edu/gazette/story/2020/02/big-step-toward-identifying-all-cancer-causing-genetic-mutations/