分类
约翰霍普金斯大学新闻

Reference genome lacks genetic material from diverse populations

在过去的17年里,世界各地的大多数科学家都把核酸序列——一组DNA信息,或主要从单个个体提取的基因组——作为一种基线参考和人类物种代表来比较群体间的遗传多样性。

被称为GRCh38参考基因组,它定期更新来自其他个体的DNA序列。但是,在一项新的分析中,约翰霍普金斯大学的研究人员现在说,910名非洲后裔的集体基因组有一个很大的纯基因组,大约有3亿比特。

“人类的DNA比我们最初想象的要多得多,”彭博社生物医学工程、计算机科学和生物统计学特约教授史蒂文·萨尔茨伯格(Steven Salzberg)说。

“整个世界都依赖于一个基本的参考基因组……这些被丢弃的信息实际上可能包含你正在寻找的答案和线索。”布隆伯格是生物医学工程、计算机科学和生物统计学的杰出教授

了解不同人群之间基因组的差异,对于揭示为什么某些人或群体或多或少易受常见健康状况(如心脏病、癌症和糖尿病)影响的研究设计至关重要。Salzberg说,科学家需要构建更多的参考基因组,更紧密地反映不同的人群。

Salzberg说:“整个世界都依赖于一个基本的参考基因组,当一个特定的DNA分析与参考基因组不匹配时,你扔掉那些不匹配的序列,这些被丢弃的片段实际上可能包含了你正在寻找的答案和线索。”

雷切尔·谢尔曼,第一作者报告,描述了在自然遗传学和鳕鱼学院计算机科学博士研究生,说,“如果你是一个科学家寻找基因变异与一个条件,在一定的人口更为普遍,你想比较基因组参考基因组更具代表性的人口。”

具体来说,世界上的参考基因组是由少数匿名志愿者的核酸序列组装而成的。根据Salzberg的说法,其他研究人员后来确定,参考基因组的70%来自一个一半是欧洲人一半是非洲人的个体,其余来自多个欧洲和中国血统的个体。

美国国家心肺血液研究所(National Heart, Lung, and Blood Institute)肺病部主任詹姆斯·基利(James Kiley)表示:“这些结果强调了对来自不同背景和祖先的人群进行研究的重要性,以创建一个全面和包容的人类基因组图谱。”

他补充说,“对人类基因组的更全面的了解可能会使我们更好地理解不同人群的疾病风险差异。”

这篇文章最初发表在JHU工程杂志上。

在科学+技术

标记计算机科学,基因组学,史蒂芬·萨尔茨伯格

新闻旨在传播有益信息,英文原版地址:https://hub.jhu.edu/2019/10/10/missing-dna-reference-genome/