最新《Science》论文:解析迄今最完整小鼠基因组图

image-47.png

北京时间2024年12月6日凌晨,《Science》杂志在线发表了西湖大学生命科学学院、西湖实验室俞晓春团队最新成果“The complete telomere-to-telomere sequence of a mouse genome”(完整的端粒到端粒小鼠参考基因组序列),报道了该团队在解析小鼠参考基因组方面取得的重要突破。这意味着人类历史上第一次看清小鼠基因组DNA全貌。

image-48.png

 注:论文截图

要掌握一个生物体的全部遗传密码,我们必须深入了解其基因组DNA的全貌。这就像是要完全阅读并理解一个由染色体构成的“图书馆”中每本DNA“书籍”中A、T、C、G这四个“字母”的具体排列顺序。基因组学,这门专注于研究生物体全部DNA的科学,其核心任务之一就是获取完整且精确的基因组序列。这一目标对于揭示基因组的结构与功能具有重大意义。这些碱基字母排序的过程,正是基因组DNA测序。在1977年,弗雷德里克·桑格开发了最初的DNA测序方法,这种方法仅能对单个基因的片段进行测序,最多只能覆盖一个完整的基因。进入21世纪,第二代测序技术被引入,它解决了第一代技术的局限性,能够同时分析成千上万的短DNA序列,因此被冠以高通量测序技术的称号;然而它也有其局限性,即所测序的DNA片段较短,通常在100到300个碱基对之间。到了2010年左右,第三代测序技术取得了突破,它能够对单个DNA分子进行直接测序,这意味着我们现在能够测序更长的DNA片段,长度可以达到10到50千碱基对,甚至更长(1千碱基对等于1000个碱基对)。鉴于人类基因组包含约30亿个碱基对,第三代测序技术的出现,因其能够读取更长的DNA片段,极大地加速了科学家们解析完整人类基因组的进程。2022年3月31日,《Science》杂志报道了“端粒到端粒联盟”这一国际科研团队完成了首个完整无间隙的人类基因组序列,这一成就填补了2003年“人类基因组计划”中未被测序的8%的基因区域。西湖大学生命科学学院的科研副院长及西湖实验室科研副主任俞晓春教授一直致力于探究DNA损伤修复的机制以及癌症的发展过程。他的研究简单来讲聚焦于如何诊断、检测和治疗由DNA损伤引起的癌症。在生命科学领域,小鼠是最为普遍的实验动物和模型生物,因此小鼠的基因组DNA信息对于探索人类健康至关重要。正由于这一点,人类对小鼠基因组DNA的理解与俞晓春教授领导的团队的研究工作紧密相连。俞晓春教授研究团队融合了多种第三代基因测序技术,打造出了一把能够深入挖掘小鼠基因潜力的“金钥匙”。他们选取了广泛使用的C57BL/6小鼠单倍体胚胎干细胞(mhaESC)作为研究样本,进行了基因测序和组装工作。通过这些努力,他们得到了一个长度为2.77 Gbp(即十亿个碱基对)的完整且高质量的小鼠参考基因组序列。这个序列中包含了215.23 Mbp(即一百万个碱基对)之前未被识别的序列,从而填补了小鼠基因组中约7.7%的未知区域。俞晓春教授的实验室通过整合“长读长”第三代测序技术,成功实现了小鼠基因组从端粒到端粒的完整组装,弥补了现有参考基因组中的空白,发现了新的基因和结构变异,完成了小鼠基因组图谱的“拼图”。这项研究不仅加深了我们对小鼠基因组结构和功能的认识,也为基因组学领域提供了宝贵的技术参考和数据资源。

image-49.png