目前基因组测序最新的方法有哪些?
PacBio在2019年发布了HiFi Reads, 兼顾了测序读长和高准确率。当下这应该算是最新的基因组测序方法。
那HiFi Reads的读长能到多长呢?准确率能到多高呢?PacBio的官方定义是长度在10k以上,准确率在Q20以上的Reads可以称为HiFi Reads(但是实际上这只是长度和准确率的下限)。
给大家看一个HiFi的实测QC数据,熟悉NGS的同学应该对这种图不陌生,可是如果我告诉你,这个测序读长是20kb,而不是Illumina的200bp,你会不会感到吃惊?
有了这样一种又长有准的测序Reads之后,对于基因组测序带来的改变是革命性的。
首先在基因组从头测序应用中,对于超大基因组组装(几十G的那种),以前的项目周期都是以年来计算的。而使用HiFi Reads之后可以缩短到十几天,并且组装质量要好于其它技术。
加州红杉具有一个超大的27G六倍体基因组,使用HiFi Reads从DNA提取到组装完成只花了17天!其中组装更是只用6天就完成。
以前对于多倍体的基因组组装是很困难的,而HiFi Reads为区分单倍型的组装提供了可能。例如下面的这个四倍体玫瑰组装案例。
在基因组重测序应用中,HiFi Reads mapping到人类参考基因组上的效果是这样的:
它解决了之前其它测序技术存在的一些问题。相对于短读长测序,HiFi Reads可以很容易的检测到难以mapping或是mapping错误的区域。相对于ONT,HiFi Reads不用再进行纠错就可以应用于下游的各种分析,包括SNVs和SV的检测。同时又长又准的特性使得HiFi Reads能够区分单倍型。
在最近的PrecisionFDA Truth Challenge V2比赛中 (2020年6-7月),PacBio HiFi Reads是所有测序技术中最准确的。有关PrecisionFDA我就不展开了,总之是非常严谨的评估了各个测序平台的数据以及各种variants calling的分析流程。感兴趣的可以参考这里:
本站所有文章、数据、图片均来自互联网,一切版权均归源网站或源作者所有。
如果侵犯了你的权益请来信告知我们删除。邮箱:dacesmiling@qq.com