最近几年,一些第二代测序方法相继取得突破。2005年,先行者454测序技术(现在已被Roche收购并推向市场)完成了对Mycoplasma genitalium全基因组的测定,这是世界上第一个由非Sanger法完成的全基因组测序。从这一刻开始,Illumina公司的Solexa技术,ABI公司的SOLiD技术,基于开源平台的Polonator技术,还有以单分子测序为目标的HeliScope和Pacificbiosciences公司的实时测序(Real-time Sequencing)技术相继映入我们的眼帘,看得我们眼花缭乱。下面,我就分别对传统的Sanger法以及第二代测序技术中的几个代表Roche 454、Illumina Solexa、ABI SOLiD,并且着重介绍个人觉得最华丽的Pacificbiosciences 实时测序技术。:P
传统测序方法
Sanger双脱氧法
如图1所示,a)首先将待测基因组序列打断成较短的DNA片段,以方便后面的处理。b)将所得的DNA片段连入质粒载体在E.coli体内扩增,使DNA片段得到富集。挑取单菌落分离纯化出其中的质粒用去测序。c)在反应体系中加入DNA聚合酶,dNTP以及带有荧光标记的双脱氧核苷酸ddNTP。由于ddNTP的链终止作用,使得对于每个片段的DNA模板,会扩增出一系列长短不一且3'端带有荧光标记ddNTP的核苷酸片段。当扩增出来的这种片段足够多的时候对于模板的每一个核苷酸位点都有相应的荧光标记3’端ddNTP与之对应。d)这样,我们通过毛细管凝胶电泳来分析这一系列标记过的核苷酸片段,收集每个位点上的荧光信号,通过软件处理,就可以得到高质量的DNA序列信息。我们前面说过,现在的Sanger测序仪采用96个毛细电泳管的阵列,可以同时进行96个这样的测序反应,每个反应得到的Read长度可以达到1000bp以上。
第二代测序方法
Roche 454 法

Illumina Solexa法

如图3所示,a)将待测基因组序列打断成较短的DNA片段,片段两端分别连接特定接头,并使双链熔解拆分为单链DNA分子。b) 通过接头将单链DNA分子随机吸附在反应板表面,然后利用桥式 PCR(bridge PCR)扩增每个单链DNA分子拷贝数。通过这一步,同种单链DNA将成簇分布在反应板表面。c)加入改造过的DNA聚合酶和带有4种荧光标记(分别针对dATP,dTDP,dGDP,dCDP)和可变粘性3'端的dNTP。对任何一条模板序列,它在聚合1bp的核苷酸后由于聚合上去的dNTP粘性末端被封闭,将无法再聚合第二个核苷酸。此时,用激光扫描反应板表面,读取每条模板序列第一轮反应所聚合上去的核苷酸种类。加入试剂去除被聚合上去的dNTP的荧光基团,然后恢复3'端粘性,继续聚合第二个核苷酸。如此继续下去,直到每条模板序列都完全被聚合为双链。这样,联合统计每轮收集到的荧光信号结果,就可以得知每个模板DNA片段的序列。这种方法一次可以同时完成3000~6000万个反应,但每个反应的Read长度暂时只能达到30bp左右。
ABI SOLiD法
如图4所示,a)将待测基因组序列打断成较短的DNA片段,片段两端分别连接特定接头,并使双链熔解拆分为单链DNA分子。b) 利用直径为1µm的DNA吸附珠与单链DNA分子特定端接头的吸附作用吸附固定单链DNA分子(控制条件使每一个珠子仅吸附一条DNA单链分子),然后利用乳化PCR(emulsion-based PCR , emPCR)扩增每个珠子上的DNA分子拷贝数,以备下一步测序使用。将珠子随机吸附在反应平板上。c)采用一系列用荧光标记的寡核苷酸(8个核苷酸)探针,探针3'端的前2个核苷酸为测序反应提供信息。ABI SOLiD法与以上几种方法显著不同的是它使用DNA连接酶而非聚合酶进行测序反应。通过连接反应,不同的寡核苷酸探针与模板序列竞争结合,只有3’端前两个核苷酸与模板链相应位置完全配对互补的探针才会被连接到模板的互补链上,这样,通过多轮反应,模板链上位置编号为(1 or 2 +8N)的核苷酸位点的序列将被测定。然后将模板互补链的引物接头延长一个核苷酸,同样的采用连接酶进行多轮测序,则模板链上位置编号为(2 or 3 +8N)的核苷酸位点的序列将被测定,如此反复几次,就可以获得模板DNA分子的全长序列信息。由于采用了更小的吸附珠子,这种方法比Roche 454法拥有更高的通量,但每个反应的Read长度暂时只能达到35bp左右。
Pacificbiosciences 实时测序技术

上面介绍了这么多种测序方法,到底那种最好呢?这个问题现在还不好回答。Roche 454商业化的最早,每Read的测序长度也比较长,但其通量仍有限,且测序成本现在还很高。Illumina Solexa和ABI SOLiD的测序通量很高,测序成本也较低,但每Read的长度太短,全基因组测序的话会有困难,除非有好的参考序列(reference)。我个人最看好的Pacificbiosciences 实时测序技术现在还没有完全成熟和商业化,因此还有许多未知数。 2008年7月,Archon X Prize Foundation宣布,如果哪个研究组使用第二代测序技术能在10天内实现对100个人的基因组完全测序,且每个基因组测序成本不高于10,000美元,他们将获得10,000,000美元的奖金。究竟那种技术会最终胜出,我们拭目以待。:P
参考文献
- M. Margulies, et al. (2005) Genome sequencing in microfabricated high-density picolitre reactors. Nature 437: 376–380
- D. Wheeler, et al. (2008) The complete genome of an individual by massively parallel DNA sequencing. Nature 452: 872–877
- J.M. Rothberg, J.H. Leamon (2008) The development and impact of 454 sequencing. Nature Biotechnology 26: 1117-1124
- J. Shendure, H. Ji (2008) Next-generation DNA sequencing. Nature Biotechnology 26: 1135-1145
- A. Boodhun, et al (2008) Accurate whole human genomesequencing using reversible terminatorchemistry. Nature 456: 53-59
- J. Eid, et al (2009) Real-time DNA sequencing from single polymerase molecules. Science 323: 133-138