分类
约翰霍普金斯大学新闻

Reference genome lacks genetic material from diverse populations

在过去的17年里,世界上的大多数科学家都使用核酸序列
2(一种DNA信息的汇编)或基因组
2(主要取自单个个体)作为一种基准参照和人类物种表征,来比较群体间的遗传多样性。

被称为GRCh38参考基因组,它定期更新来自其他个体的DNA序列。但是,在一项新的分析中,约翰霍普金斯大学的研究人员现在说,910名非洲后裔的集体基因组中有一个巨大的纯基因组,大约有3亿比特的纯基因组。

彭博社生物医学工程、计算机科学和生物统计学杰出教授史蒂文•萨尔茨伯格说:“人类的DNA比我们最初想象的要多得多。”

“整个世界都依赖于一个简单的参考基因组,……(而且)这些被丢弃的碎片实际上可能包含了你正在寻找的答案和线索。”著名教授,生物医学工程,计算机科学和生物统计学

了解不同人群基因组的差异,对于揭示为什么某些人或某些人群或多或少易受心脏病、癌症和糖尿病等常见健康状况影响的研究设计至关重要。萨尔茨伯格说,科学家需要建立更多的参考基因组,更紧密地反映不同的人群。

Salzberg说:“整个世界都依赖于一个基本的参考基因组,当一个特定的DNA分析与参考基因组不匹配时,你扔掉那些不匹配的序列,这些被丢弃的片段实际上可能包含了你正在寻找的答案和线索。”

雷切尔·谢尔曼,第一作者报告,描述了在自然遗传学和鳕鱼学院计算机科学博士研究生,说,“如果你是一个科学家寻找基因变异与一个条件,在一定的人口更为普遍,你想比较基因组参考基因组更具代表性的人口。”

具体来说,世界上的参考基因组是由少数匿名志愿者的核酸序列组装而成的。据萨尔茨伯格说,其他研究人员后来确定,70%的参考基因组来自一个一半是欧洲血统、一半是非洲血统的个体,其余来自多个欧洲和中国血统的个体。

支持这项研究的美国国家心肺血液研究所(National Heart, Lung, and Blood Institute)肺病科主任詹姆斯·基利(James Kiley)表示:“这些结果凸显了对来自不同背景和祖先的人群进行研究的重要性,以创建一个全面、包容的人类基因组图谱。”

他补充说,“对人类基因组更全面的了解,可能有助于更好地理解不同人群疾病风险的差异。”

本文最初发表在JHU工程杂志上。

在科学+技术

标记计算机科学,基因组学,史蒂芬·萨尔斯伯格

新闻旨在传播有益信息,英文原版地址:https://hub.jhu.edu/2019/07/08/missing-dna-reference-genome/