Nature Methods | 利用ONT数据进行二倍体物种端粒到端粒组装新方法

长读长测序技术(ONT和PacBio HiFi )的进步加速了从头基因组组装方法的开发。如广泛使用的DipAsm 、hifiasm 、HiCanu 、phasebook 和 Peregrine等基因组组装软件,这使得研究人员能够便捷的进行高质量基因组的组装。但是,这些大多数组装软件是基于 HiFi 数据开发的。为了更好的组装 ONT reads,也已经开发了许多基于 ONT reads的组装软件(例如 Canu 、 Flye 、 Raven 、 wtdbg和 NECAT)。然而,由于ONT reads的准确性低于HiFi reads,使得基于ONT reads的组装质量仍然低于基于HiFi的组装。尽管ONT reads测序技术进行了多次升级,碱基检测算法和实验方法的改进提高了碱基准确性,但目前的准确性仍然较低,特别是高度串联重复的区域。除了组装的错误率之外,大多数基于 ONT 的组装软件的另一个缺点是它们仅能进行单倍体的组装,而许多基于 HiFi 的组装软件能够获得可以重建二倍体的组装。

《Nature Methods | 利用ONT数据进行二倍体物种端粒到端粒组装新方法》
近日,新加坡基因组研究所的Ramesh Rajaby教授和香港基因组研究所的宋永健教授在国际著名期刊Nature methods 在线发表了“Constructing telomere-to-telomere diploid genome by polishing haploid nanopore-based assembly | Nature Methods”的研究性论文。使用ONT、Illumina和Hi-C reads组装获得连续且几乎完整的基因组组装算法hypo-assembler,其组装质量与基于HiFi的组装结果相当。

《Nature Methods | 利用ONT数据进行二倍体物种端粒到端粒组装新方法》
图1  hypo-short 和hypo-hybrid基因组修饰器的六个步骤

Hypo-short 主要利用 Illumina reads来降低基于 ONT 的草图组装,Hypo-hybrid使用短reads和长reads来减少组装结果中的错误,并获得高质量的二倍体基因组。基于hyper-hybrid,作者进一步开发了hyper-assembler的二倍体基因组组装流程。Hypo-assembler 使用 ONT 长reads、Illumina 短reads和可选的 Hi-C  reads来自动的进行高度准确、连续且几乎完整的二倍体基因组的组装,并最终获得端粒到端粒完整二倍体基因组。

《Nature Methods | 利用ONT数据进行二倍体物种端粒到端粒组装新方法》

图2  hyper-assembler 组装的流程

研究结果为其他植物端粒到端粒的组装、二倍体基因组的组装提供了新的思路和工具。在弥补错误率问题的同时还能组装高质量的基因组,为今后研究植物基因组组装领域的发展奠定基础或提供技术支持。

原文链接:

https://www.nature.com/articles/s41592-023-02141-1

文章来源:植物生物技术Pbj

《Nature Methods | 利用ONT数据进行二倍体物种端粒到端粒组装新方法》

点赞

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注