如今,基因组测序的新闻已变得司空见惯,不像几年前,基因组草图甚至能登上杂志的封面。随着测序仪的价格不断下探,你也考虑购入一台。挑来选去,不知哪一台更好。在这一期的《BioTechniques》上,Jeffrey Perkel告诉你,一台也许并不够。
新一代测序仪在上市之初,价格高昂,仅限“土豪”实验室购买。如今,选择多了,价格也便宜了。比如Illumina新近推出的MiniSeq测序仪,售价仅为49,500美元(美国售价),每次运行有望产生7.5 Gb,足以应对靶向测序的应用。在爱丁堡大学,本科生甚至可以选修一门课程,用Illumina的NGS技术来破译细菌基因组。
然而,在第一台NGS仪器上市十年后,序列组装仍然是个挑战。即使是5.2 Mb的脆弱拟杆菌(Bacteroides fragilis)基因组,也给爱丁堡大学的本科生带来不少麻烦,这归因于重复和移动的调控元件。不过,研究人员正在学习通过不同的测序技术,来理清这些区域。
Evan Eichler是华盛顿大学医学院的一名教授,他研究的是传统基因组测序项目往往忽视的基因组区域,比如不稳定的区域。这些区域的两端伴随着长片段重复,在减数分裂的过程中可能没对准,导致插入/缺失,或重复。Eichler表示,目前有证据表明这些区域是基因进化的摇篮,它们甚至在某种程度上解释了人何以为人。同时,这些复杂的区域也与疾病相关。
当今,研究人员在测序人类基因组时,大多采用短读长的Illumina测序技术。这种策略将基因组剪切成数百万个小片段,平行读取,然后在数据分析环节将每个片段与基因组的独特序列比对,并鉴定出相对于人类参考基因组的变化。这些算法目前还不能实现基因组的从头(de novo)组装,因此,无法捕获大规模的结构变异。
不过,其他方法可以做到。Pacific Biosciences和Oxford Nanopore的仪器在原理、速度和价格上有所不同,但它们都带来了比Illumina、Ion Torrent长得多的读取片段。PacBio的平均读长达10 kb,有些甚至超过60 kb;Oxford Nanopore的MinION读长要短一些,但也在kb级别。
就每个碱基而言,这些技术比Illumina要贵,“原始”错误率更高,并产生了更少的序列。因此,使用这些技术的研究人员需要开展更多的测序运行。不过,如果他们将长读取和短读取技术相结合,就能解决那些之前无法搞定的区域。
再回到Eichler研究的第17号染色体。17q21.31含有一段900 kb的倒位和许多重复基因,它们往往会在测序过程中丢失或错误组装。不过,Eichler的团队如今结合使用Illumina和PacBio的技术,不仅大大提高了测序质量,也明显降低了测序成本。Eichler认为,这种策略有助于增加我们对人类遗传变异的认识。
最近几个月,PacBio和Illumina都推出了新的测序仪。PacBio的Sequel在去年9月推出,比RS II更小巧、更便宜,但通量大大提高。Illumina的MiniSeq也在1月份上市,有望真正降低新一代测序的门槛。如今的你们,有了更多的选择。