NBT:主流高通量测序仪在人/细菌/宏基因组测序评测结果发布

发布者:方治伟发布时间:2021-12-06浏览次数:771

近日,由生物分子资源设施协会(Association of Biomolecular Resource Facilities, ARBF)主导的ABRF NGS II期研究成果发表于Nature Biotechnology,文章题为“Performance assessment of DNA sequencing platforms in the ABRF Next-Generation Sequencing Study”。研究团队基于来自Illumina、Pacific Biosciences、Thermo Fisher Scientific、BGI、Oxford Nanopore Technologies和Genapsys的多款测序平台,在多个实验室对同一人类基因组家族、三个单独菌株和十种细菌的宏基因组混合物进行测序,并将各平台数据进行全方位、系统性比较,分析各个测序平台的性能差异和测序质量,以提供真实全面的参考证据。

数据显示,在短读长测序平台中,Illumina的HiSeq 4000和HiSeq X10平台提供了最一致、最高的基因组覆盖率,华大智造的BGISEQ-500、MGISEQ-2000平台提供了最低的测序错误率。在长读长测序平台中,PacBio CCS具有最高的基于参考的映射率和最低的非映射率。PacBio CCS和Oxford Nanopore的PromethION、MinION平台在重复序列丰富的区域和跨均聚物检测中均显示出最佳的序列定位性能。NovaSeq 6000使用2×250 bp读取化学是捕获已知INDEL事件的最强大的仪器。

研究团队在约30个实验室通过不同技术平台进行同一人类基因组测序,包括Illumina的HiSeq、NovaSeq系列平台,Thermo Fisher的Ion S5、Proton平台,PacBio的CCS平台、Oxford Nanopore的PromethION、MinION、Flongle平台,华大智造的BGISEQ-500、MGISEQ-2000平台,Genapsys的GS111平台。除Ion Proton和S5平台进行全外显子组测序外,利用其它平台进行了全基因组测序。

对于细菌基因组,研究团队使用Illumina MiSeq,Thermo Fisher Ion PGM和S5,Oxford Nanopore MinIon、Flongle和Genapsys的GS111平台对宏基因组样本进行了测序。

后续数据分析包括各平台产生的reads比对到基因组的能力、测序覆盖度、复杂区域测序错误率、不同突变类型的检出率以及影响因素等。通过这些全面的系统比较分析,为各平台比较和选择提供真实有效的参考。

01

基因组覆盖率:各测序平台均表现较好

分析发现,以25X对测序深度进行均一化后,长读长和短读长测序平台的基因组覆盖度均表现较好。在短读长测序平台中,Illumina的HiSeq 4000和HiSeq X10提供了最稳定、最高的基因组覆盖率。

DNA重复序列分为Alu、L1、L2、LTR、微卫星、简单重复和端粒区域。对于DNA重复序列的检测:BGISEQ-500、HiSeq4000、NovaSeq 2x150bp在捕获Alu区域时具有优势;HiSeq 2500、HiSeq X10和NovaSeq 2x150bp在捕获L1、L2和低复杂度区域表现最好;PacBio CCS和NovaSeq在微卫星区域和简单重复区域的测序中表现最好;PromethION平台擅长捕获端粒区域。

02

测序错误率:BGISEQ-500、

MGISEQ-2000的错误率最低
在测序错误率层面,各个平台在GC含量较高的区域均出现了较高的错误率。在短读长测序平台中,BGISEQ-500、MGISEQ-2000提供的测序错误率最低。在错误模式层面,DNBSEQ平台和Illumina平台更偏向于核苷酸替代,两个平台的灵敏度相似,其中华大智造的精度更胜一筹。Genapsys平台和长读长测序平台的最主要错误来源是INDEL。 

03

SNV和INDEL突变检测:

华大智造DNBSEQ平台表现亮眼

SNV和INDEL是常见的DNA突变类型。在SNV的检出中, 华大智造的BGISEQ-500、MGISEQ-2000平台最为灵敏,其次是NovaSeq 2x250bp、NovaSeq 2x150bp、HiSeq 2500、HiSeq X10和HiSeq4000。在INDEL的检出中,所有平台灵敏度均达到99.5%,华大智造的BGISEQ-500、MGISEQ-2000平台和NovaSeq的检出相似,且优于其他平台。PacBio、Nanopore平台对于SNV和INDEL的捕获能力均较弱。

04

细菌基因组测序


宏基因组数据可以帮助开发临床宏基因组学,甚至为临床测序的其他用途提供信息。了解平台在不同GC环境中的表现对于人类测序至关重要,使用这些数据来改进临床测序的质量控制也有助于最大限度地降低成本。

该研究中,ThermoFisher的Ion PM和S5平台在错误率方面略胜一筹。对于复杂的宏基因组样本,Illumina MiSeq,Thermo Fisher Ion PGM、S5,Oxford Nanopore MinIon等所有平台都能够识别混合物中的所有菌株,但对基因突变的捕获水平差异较大。 


该研究共同第一作者、美国纽约威尔康奈尔医学院生理与生物物理系Jonathan Foox教授表示:“在研究人类基因组及其组成时,我们总是尽可能地接近真实的事实。虽然这不能直接解决问题,但将有助于创建一个强大而可靠的基线,并以此作为任何个体基因组的参考”。

ABRF NGS二期研究是一项全面的DNA测序性能评估依据,同时也提供了重要的参考资源。但并不是将一种系统与另一种系统进行比较,只是提供最为客观的证据。更为重要的是,大家可以根据这些数据集为自己的研究设定基线,并以此来选择适合自己研究的测序平台。同时,该研究再次支持了测序领域的一些传统观点,例如长读长和短读长测序方法最终将在临床应用中实现互补。

通过横向比较分析,该研究为大家展示了不同测序技术和平台的性能,除了传统短读长测序技术的长期优势再次得到佐证,更多新技术平台的优势也值得更多关注,例如华大智造DNBSEQ国产平台、Genapsys平台和Oxford Nanopore的Flongle等新技术的强劲展示。通过该研究,大家不仅看到了各个测序平台的“百花齐放”,同时也看到这些新兴测序平台依托精益求精的性能指标,正在不断成长。作为国产测序平台的领跑者,华大智造DNBSEQ平台基于其独特的测序文库方法,在该研究中表现亮眼,且独具优势。分析表明,华大智造测序平台(文库制备和测序)可提供高质量的WGS,包括变异检测的敏感性和特异性。这些优势对基因研究和诊断应用非常重要。

该研究通讯作者之一、美国纽约威尔康奈尔医学院生理与生物物理系Christopher E. Mason教授提道:“BGI是唯一一家有员工作为研究合著者参与的NGS提供商”。

华大智造表示,该研究中的WGS数据是基于PE150 读长,现在DNBSEQ测序平台已经有能力进行PE200读长的测序,PE300读长的试剂盒正在开发中

关于ABRF

ABRF于1989年正式组建,成员包括来自41个国家/地区、340个不同核心实验室的1000多位科学家,成员来自工业界、政府、学术界以及研究机构。ABRF致力于通过研究、交流和教育推进生物技术实验室的核心竞争力和研究。


参考资料:
1.Foox, J., Tighe, S.W., Nicolet, C.M. et al. Performance assessment of DNA sequencing platforms in the ABRF Next-Generation Sequencing Study. Nat Biotechnol 39, 1129–1140 (2021).
2.ABRF Study Benchmarks NGS Platforms on Human, Microbial Samples, Provides Peek at Genapsys Data
https://www.genomeweb.com/sequencing/abrf-study-benchmarks-ngs-platforms-human-microbial-samples-provides-peek-genapsys-data#.YUvsKVHYuM8
3.Schuster, S. C. Next-generation sequencing transforms today’s biology. Nat. Methods 5, 16–18 (2008).
4.Zook, J. M. et al. An open resource for accurately benchmarking small variant and reference calls. Nat. Biotechnol. 37, 561–566 (2019).