Friday, January 09, 2009

Next-generation Sequencing Technique

当终于认识到核酸才是生命的遗传物质,明白了地球上一切生物的生老病死之迷都蕴藏在那AT(U)GC四个字母组成的浩瀚序列中之后,核酸(这里主要指DNA)测序技术的研究和开发便成了生物学研究的重中之重。上世纪70年代,随着Frederick Sanger的双脱氧法和Allan Maxam-Walter Gilbert 的化学降解法的发明,这一难题终于得到了根本性的解决。1980年,Sanger和Gilbert由于这一贡献,共同荣获Nobel化学奖。但DNA测序的故事到这里却远未结束。在接下来的30多年中,实现更长的测序片段长度和更高的测序反应通量成了众多生物学家、化学家乃至计算机学家、材料学家及工程师们不懈努力的目标。经过他们的努力,现在主流的Sanger双脱氧法测序的单个测序片段长度已经能达到1000bp,并且测序通量已经提升到了同时完成96个独立反应。但Sanger法测序依赖于电泳,而电泳设备(仅管现在使用的已经是毛细管阵列)的体积又限制了Sanger法测序向更高通量的发展。并且,Sanger法对测序样品的前期准备要求较高,并且这个准备过程步骤繁杂,难以自动化,费时、费钱、费人力。正是看到了Sanger法这些难以克服的瓶颈,研究人员们不得不放弃Sanger法,开始各显神通,另辟蹊径,寻找新的解决方案——第二代测序技术。这种新的测序方法应该有以下几个特点:高通量、高自动化、高精确度、低成本并且测序片段长度尽可能长。

最近几年,一些第二代测序方法相继取得突破。2005年,先行者454测序技术(现在已被Roche收购并推向市场)完成了对Mycoplasma genitalium全基因组的测定,这是世界上第一个由非Sanger法完成的全基因组测序。从这一刻开始,Illumina公司的Solexa技术,ABI公司的SOLiD技术,基于开源平台的Polonator技术,还有以单分子测序为目标的HeliScope和Pacificbiosciences公司的实时测序(Real-time Sequencing)技术相继映入我们的眼帘,看得我们眼花缭乱。下面,我就分别对传统的Sanger法以及第二代测序技术中的几个代表Roche 454、Illumina Solexa、ABI SOLiD,并且着重介绍个人觉得最华丽的Pacificbiosciences 实时测序技术。:P


传统测序方法

Sanger双脱氧法


如图1所示,a)首先将待测基因组序列打断成较短的DNA片段,以方便后面的处理。b)将所得的DNA片段连入质粒载体在E.coli体内扩增,使DNA片段得到富集。挑取单菌落分离纯化出其中的质粒用去测序。c)在反应体系中加入DNA聚合酶,dNTP以及带有荧光标记的双脱氧核苷酸ddNTP。由于ddNTP的链终止作用,使得对于每个片段的DNA模板,会扩增出一系列长短不一且3'端带有荧光标记ddNTP的核苷酸片段。当扩增出来的这种片段足够多的时候对于模板的每一个核苷酸位点都有相应的荧光标记3’端ddNTP与之对应。d)这样,我们通过毛细管凝胶电泳来分析这一系列标记过的核苷酸片段,收集每个位点上的荧光信号,通过软件处理,就可以得到高质量的DNA序列信息。我们前面说过,现在的Sanger测序仪采用96个毛细电泳管的阵列,可以同时进行96个这样的测序反应,每个反应得到的Read长度可以达到1000bp以上。


第二代测序方法

Roche 454 法


如图2所示,a)将待测基因组序列打断成较短的DNA片段,片段两端分别连接特定接头,并使双链熔解拆分为单链DNA分子。b) 利用直径为28µm的DNA吸附珠与单链DNA分子特定端接头的吸附作用吸附固定单链DNA分子(控制条件使每一个珠子仅吸附一条DNA单链分子),然后利用乳化PCR(emulsion-based PCR , emPCR)扩增每个珠子上的DNA分子拷贝数,以备下一步测序使用。c-e)将每个珠子置于隔离反应井中(每个反应井55 µm 深 ,直径44 µm )。f)Roche 454使用焦磷酸法测序,其反应原理是在DNA聚合酶、ATP硫酸化酶 ( ATP:sulfurylase 或 ATP:sulfate adenylyltransferase)、荧光素酶 ( luciferase)和三磷酸腺苷双磷酸酶( apyrase) 4种酶的协同作用下,将每一个dNTP的聚合与一次荧光信号的释放偶联起来。f)记录并分析这些荧光信号,就可以获得高质量的DNA序列。Roche 454法现在每次可以同时进行400,000个反应,每个反应得到的Read长度可以达到500bp左右。


Illumina Solexa法


如图3所示,a)将待测基因组序列打断成较短的DNA片段,片段两端分别连接特定接头,并使双链熔解拆分为单链DNA分子。b) 通过接头将单链DNA分子随机吸附在反应板表面,然后利用桥式 PCR(bridge PCR)扩增每个单链DNA分子拷贝数。通过这一步,同种单链DNA将成簇分布在反应板表面。c)加入改造过的DNA聚合酶和带有4种荧光标记(分别针对dATP,dTDP,dGDP,dCDP)和可变粘性3'端的dNTP。对任何一条模板序列,它在聚合1bp的核苷酸后由于聚合上去的dNTP粘性末端被封闭,将无法再聚合第二个核苷酸。此时,用激光扫描反应板表面,读取每条模板序列第一轮反应所聚合上去的核苷酸种类。加入试剂去除被聚合上去的dNTP的荧光基团,然后恢复3'端粘性,继续聚合第二个核苷酸。如此继续下去,直到每条模板序列都完全被聚合为双链。这样,联合统计每轮收集到的荧光信号结果,就可以得知每个模板DNA片段的序列。这种方法一次可以同时完成3000~6000万个反应,但每个反应的Read长度暂时只能达到30bp左右。


ABI SOLiD法

如图4所示,a)将待测基因组序列打断成较短的DNA片段,片段两端分别连接特定接头,并使双链熔解拆分为单链DNA分子。b) 利用直径为1µm的DNA吸附珠与单链DNA分子特定端接头的吸附作用吸附固定单链DNA分子(控制条件使每一个珠子仅吸附一条DNA单链分子),然后利用乳化PCR(emulsion-based PCR , emPCR)扩增每个珠子上的DNA分子拷贝数,以备下一步测序使用。将珠子随机吸附在反应平板上。c)采用一系列用荧光标记的寡核苷酸(8个核苷酸)探针,探针3'端的前2个核苷酸为测序反应提供信息。ABI SOLiD法与以上几种方法显著不同的是它使用DNA连接酶而非聚合酶进行测序反应。通过连接反应,不同的寡核苷酸探针与模板序列竞争结合,只有3’端前两个核苷酸与模板链相应位置完全配对互补的探针才会被连接到模板的互补链上,这样,通过多轮反应,模板链上位置编号为(1 or 2 +8N)的核苷酸位点的序列将被测定。然后将模板互补链的引物接头延长一个核苷酸,同样的采用连接酶进行多轮测序,则模板链上位置编号为(2 or 3 +8N)的核苷酸位点的序列将被测定,如此反复几次,就可以获得模板DNA分子的全长序列信息。由于采用了更小的吸附珠子,这种方法比Roche 454法拥有更高的通量,但每个反应的Read长度暂时只能达到35bp左右。



Pacificbiosciences 实时测序技术

如图5所示,a)将DNA聚合酶固定在直径为100nm的zero-mode waveguide(ZMW)上,通过对调节的控制,可以实现每个waveguide顶端表面仅吸附一个DNA聚合酶。ZMW的纳米结构为DNA聚合反应提供良好的反应隔离条件。b)为对四种dNTP的磷酸基团做不同颜色的荧光标记,然后让这些dNTP进行DNA聚合反应。这样,每一个被聚合到模板链的互补链上的dNTP都会释放出代表着这个种碱基的荧光信号,而且随着后一个dNTP的聚合反应,前面已经结合上去的dNTP分子的荧光信号会被猝灭。c)荧光信号通过ZMW被电脑终端所收集并进行详细分析,从而获得模板DNA分子的真实序列。该方法与前面几个方法的差别主要体现在不需要对DNA样品做富集化处理,这意味着前期准备工作会轻松很多。该方法是伴随着DNA分子聚合反应的实时测序法,其可靠性有很好的保证。该研究组发表在Science 2009年第一期上的文章表明他们的这种方法已经能将每个Read的长度扩展到1000bp,即可以媲美传统的Sanger测序法,而ZMW的nm级的规格将有助于大大提高测序通量以及实现测序仪小型化。另外,该技术对待测DNA样本的要求很低,不需要做前期扩增,因此大大提升了整个测序过程的自动性,拥有非常好的应用前景。虽然这项测序技术现在还没有被全基因组测序所检验,但相信很快就会有这方面的报道,并且很快实现产品商业化。

上面介绍了这么多种测序方法,到底那种最好呢?这个问题现在还不好回答。Roche 454商业化的最早,每Read的测序长度也比较长,但其通量仍有限,且测序成本现在还很高。Illumina Solexa和ABI SOLiD的测序通量很高,测序成本也较低,但每Read的长度太短,全基因组测序的话会有困难,除非有好的参考序列(reference)。我个人最看好的Pacificbiosciences 实时测序技术现在还没有完全成熟和商业化,因此还有许多未知数。 2008年7月,Archon X Prize Foundation宣布,如果哪个研究组使用第二代测序技术能在10天内实现对100个人的基因组完全测序,且每个基因组测序成本不高于10,000美元,他们将获得10,000,000美元的奖金。究竟那种技术会最终胜出,我们拭目以待。:P


参考文献

  1. M. Margulies, et al. (2005) Genome sequencing in microfabricated high-density picolitre reactors. Nature 437: 376–380

  2. D. Wheeler, et al. (2008) The complete genome of an individual by massively parallel DNA sequencing. Nature 452: 872–877

  3. J.M. Rothberg, J.H. Leamon (2008) The development and impact of 454 sequencing. Nature Biotechnology 26: 1117-1124

  4. J. Shendure, H. Ji (2008) Next-generation DNA sequencing. Nature Biotechnology 26: 1135-1145

  5. A. Boodhun, et al (2008) Accurate whole human genomesequencing using reversible terminatorchemistry. Nature 456: 53-59

  6. J. Eid, et al (2009) Real-time DNA sequencing from single polymerase molecules. Science 323: 133-138

2 comments:

Xiaoxi said...

thank you so much *_*

Jia-Xing Yue said...

RE: liu

呵呵,你太客气了,我也是现学现卖,再说科学的核心精神之一就是分享嘛:P