20年前,“人类基因组计划”完成了对人类基因组30亿个碱基对的测序。中国作为其中唯一的发展中国家承担了1%的测序任务。从此,“人类参考基因组”成为人类遗传学和医学研究的遗传密码“导航图”。
20年后,这张基因“导航图”有了中国制造的“中国版”,首个中国人群专属的泛基因组参考图谱发布。日前,复旦大学、西安交大、中国医学科学院等26家单位在国际学术期刊《自然》上联合发布相关成果。这是我国科学家独立完成的人群基因组研究首次发表在《自然》。
悠久的人群历史、丰富的地理气候环境,塑造了中华民族独特的遗传多样性。2021年1月,复旦大学教授徐书华、西安交通大学教授叶凯联合国内26家单位发起了中国人群泛基因组联盟,旨在形成我国自主可控的人类基因组资源与核心技术,服务人民生命健康。联合研究团队对涵盖中国36个族群的58个样本进行了深度测序和高质量分析,构建了首个高质量中国人群参考泛基因组。
多维视角的“中国版导航图”
基因在什么位置?如何排列?相比过去“一维线性”的人类参考基因组,此次提供的“中国版导航图”升级为“多维”。
徐书华告诉记者,人类的基因片段有多样性特征,以往的“导航图”只提取其中一部分特征,不仅相对“简单粗暴”,还缺失了许多关键遗传信息。“中国版导航图”从每个样本中发现了将近70兆在传统参考基因组漏缺的新基因序列。“人类有23对染色体,最大的约250兆,最小的约47兆。这70兆的遗传信息量不小,可能蕴含了科学家一直在寻找的肝癌、肺癌、Ⅱ型糖尿病、精神分裂症等复杂疾病的遗传基础。”
这项研究初步构建了我国人群的泛基因组参考图谱,发现了在人类通用参考基因组上缺失的约1.9亿个碱基对的参考序列。不同于“线性导航图”主要考虑核心共有的基因序列,“中国版导航图”综合考虑了个性化的基因序列,这正是“泛基因组”的内涵,有了更多维的视角。这对于重构人类演化历程、挽回“丢失的遗传率”,具有巨大的潜在价值。
展现过去20年的科研积淀
“您的身上可能有大约1%尼安德特人的基因序列,大约5‰丹尼索瓦人的基因序列。”徐书华告诉记者,此次“中国版导航图”有些有趣的发现或印证。
比如,中国人的基因序列中有些并不是来自直系祖先,而是来自已经灭绝的尼安德特人或丹尼索瓦人或其他古人类。“这可能是3万年前亚洲人的祖先与之有过交集,并留存了后代。”徐书华说,研究团队对这些基因序列进一步分析发现,它们竟然与我们的指甲头发的发育、紫外线辐射应激、DNA修复、免疫反应甚至寿命等相关。
“这反映了我们的基因组中可能仍有大片有价值的矿藏尚未得到充分开采。”论文共同作者、中国科学院院士、复旦大学校长金力说。
此次“中国版导航图”新鉴定了约580万个点突变或小变异以及3.4万个结构变异,涉及至少1367个蛋白质编码的基因序列。“我想强调的是,基因组结构变异大概是生物进化中从微观到宏观演变的关键遗传基础,也是最有可能连接渐变到跃变这个‘鸿沟’的进化密码。我相信,通过对基因组结构变异的高精度解析,不但能大幅提升‘基因型—表型’关联分析的功效,而且有可能最终帮助我们理解生命演化中重要性状和功能产生的遗传基础和分子机制。”金力说。
从承担人类基因组计划“1%”的测序任务,到中国人群泛基因组图谱“100%”由中国科学家完成,这展现了中国生命科学尤其是基因组学在过去20年间的科研积淀和历史性跨越。
徐书华介绍,“中国版导航图”虽然是一个纯粹的基础研究,但一经发布立即可用,所有和基因相关的科学研究,比如人类遗传学、医学、药物基因组学等都能以此为参照。“这是纯公益的,我们正在进一步提升算法和优化参考图质量,希望未来可达成‘一键式’生成‘导航’结果。”