X chromosome floating in blue background

信用:盖蒂图片社

X染色体是第一人染色体以从一端至另一端被完全测序,与序列中没有间隙和准确性的前所未有的水平。

虽然目前人类参考基因组是有史以来最准确和完整脊椎动物基因组中,仍然存在于DNA序列的空白,在20年之后的改进。现在,对于第一次,科学家们已经确定的人染色体的完整序列从一个端部到另一个(“端粒端粒”)没有间隙和准确性的前所未有的水平。

端粒到端粒的组件的完整的人X染色体的出版 7月14日在本质上 是一个里程碑式的成就为基因组学研究。主要作者卡伦多边投资担保机构,在澳门赌场圣克鲁斯分校基因组研究所的科学家说,该项目是由新的测序技术,使“超长时间读取”等成为可能 纳米孔测序技术 在澳门赌场圣克鲁斯分校首创。

重复DNA序列是整个基因组中常见的,并一直提出了挑战,进行测序,因为大多数技术能够产生相对较短的“读”的顺序,然后有一个像拼图组装基因组被拼凑起来的。重复序列产生大量的短的读取外观几乎一样,像一个谜一大片蔚蓝的天空,没有线索如何组合在一起或有多少重复的也有。

“这些丰富的重复序列,曾经被认为难治,但现在我们已经取得了测序技术的突飞猛进,” MIGA说。 “用纳米孔测序,我们得到超长读几十万个碱基对的,可以跨越整个重复区域,使绕过一些挑战。”

在人类基因组序列中剩余填补空白开启了基因组的研究人员在那里可以搜索序列变异与疾病之间和其他线索,对人类生物学和进化的重要问题,协会的新区域。

“我们已经开始发现一些这些地区,那里有参考序列的差距实际上是最富有的人群中的变化之中,所以我们已经错过了很多的信息,可能是理解人类生物学的重要的和疾病“,MIGA说。

端粒端粒

Chromosome ideogram
染色体表意文字表示组件中的人类基因组chm13的全基因组,超过连续性,完整性和精确度方面的所有先前人类基因组组装。 X染色体被放大在右边。无缝重叠群被示为旁边的染色体表意文字蓝色和橙色条。 点击查看大图
信用:多边投资担保机构等,自然2020

多边投资担保机构和国家人类基因组研究所(NHGRI)亚当phillippy,新纸张的通讯作者,共同创立了 端粒到端粒(T2T)的联盟的 追求一个完整的基因组上的合作组装后 2018纸 这证明了纳米技术生产一个完整的人类基因组序列的潜力。这种努力中使用的纳米孔牛津技术仆从序,通过检测在电流流动的DNA通的单个分子通过一个微小的孔在膜中的变化(“纳米孔”)序列的DNA。

新项目建立在这一努力中,纳米孔测序结合与pacbio和Illumina公司,和光地图等测序技术,从基因组学的生物纳米。使用这些技术,该球队产生超过在连续性,完整性和精确度方面的所有先前人类基因组组装一个全基因组装配,甚至超过由一些度量目前人类基因组参考。

尽管如此,仍然有序列中多休息,MIGA说。完成X染色体,球队不得不在序列中手动解决一些差距。 2次片段重复使用超长纳米孔已经解决读取完全跨越了重复并唯一固定在两侧。剩余的突破是在着丝粒,重复DNA的一个非常困难的区域,每一个染色体中发现。

在X染色体,着丝粒包含高度重复的DNA跨越310万个碱基对的区域(碱基A,C,在其序列中的DNA双螺旋和编码遗传信息吨,和g形式对)。该小组能够在重复序列内识别变异作为标记,这是他们用来对准长读取,并将它们连接起来,覆盖整个着丝粒。

“对我来说,这个想法,我们可以把一个3兆碱基大小的串联重复仅仅是令人兴奋的。我们现在可以达到覆盖数以百万计的先前认为棘手的基地,这些重复区域,” MIGA说。

抛光战略

Karen Miga gives a talk, electric background
在澳门赌场圣克鲁斯分校基因组学研究所的科学家卡伦MIGA导致端粒对端粒装配了完整的人类X染色体。
信用:澳门赌场圣克鲁斯分校

下一步骤是使用来自多个测序技术数据,以确保该序列中每个碱基的精度研磨策略。

“我们使用迭代过程在三个不同的测序平台以抛光该序列和精度达到一个高水平,” MIGA说明。 “独特的标记提供了超长的锚定系统读取,一旦你锚读取,你可以使用多个数据集来调用每个基地。”

纳米孔测序,除了提供超长读,还可以检测已被甲基化,这并不改变顺序,但对DNA结构和基因表达有重要影响的“后生”变化修饰碱基。由X染色体上的甲基化映射模式,该小组能够证实以前的意见和着丝粒中揭示甲基化模式的一些有趣的趋势。

新的人类基因组序列,从称为chm13人细胞系衍生的,关闭当前参照基因组的许多间隙,被称为基因组参照财团构建38(grch38)。

该财团T2T继续向所有chm13染色体的完成工作。 “这是一个开放的联盟,所以在很多方面,这是一个社区驱动的项目,有很多的人奉献时间和资源给它,” MIGA说。

除了多边投资担保机构和phillippy,该论文的作者包括美国国家人类基因组研究所共同第一作者谢尔盖·科伦和科学家在近二十几机构和英国,包括华盛顿,约翰·霍普金斯大学的大学,澳门赌场圣地亚哥分校,和Wellcome Sanger研究所。这项工作是由美国支持美国国立卫生研究院。