Saturday, June 06, 2009

Signaling Signature in Situ

从核酸到蛋白,从序列到功能,一切的生命现象都可以归纳到这个过程中去。所以,我们对生命现象的探索也自然而然的可以大体分为2个层次:1.从浩如烟海的基因组数据中找出基因和其它重要的遗传元件,在序列水平上解读生命遗传信息的第一手资料。2.研究基因在生物体中是如果被激活,被表达,被调用的,从而建立起从静态的序列信息到动态的生物功能的桥梁。对于第一个层次的研究,过去半个世纪分子生物学经典研究的积累和当今高通量测序技术突飞猛进的发展和进步已经让我们走上了快车道;而对于第二个层次的研究,我们仍然是刚刚起步。诚然,在过去的一二十年中,我们对这方面的研究已经投入了很大努力,曾经火热的生物芯片和分子信号转导的研究就是明证。但我觉得这里面存在一个很大的一个问题。过去由于研究手段的限制,我们基本上只能通过体外(in vitro)实验来研究基因的转录、表达和调控,然而生物的功能毕竟是要在体内(in vivo)环境中实现的,而体内和体外环境的差异(包括物化特性和生物特性)可能远超过我们的想象,这就导致了一个我们必须面对的问题:我们体外实验所得到的结果有多少是真正与生物体内的真实情况相符合的?在涉及到对复杂生物现象的研究时这个问题尤其需要考虑。

在这样的背景下,怎样将相对成熟的体外实验通过一定得方法在体内重现一直是当前生物学研究中令人瞩目的领域,比如我曾经写过的利用DSLM跟踪脊椎动物如斑马鱼的胚胎发育过程,再比如今天我要介绍的通过FRET在全胚胎水平对影响生物发育的一个关键蛋白Cdc42的体内激活模式的实时跟踪研究,这个成果发表在这周的Science上(2008 Jun 5)。

首先介绍下FRET技术吧,FRET(Forster Resonance Eenergy Transfer)即荧光共振能量转移,是指当两个荧光发色基团在足够靠近时,受外界环境(如紫外光)激发的供体分子通过偶极-偶极耦合作用向邻近的受体分子转移能量的过程。尤其是结合绿色荧光蛋白(Green Fluorescent Protein,GFP)的发明,这项技术被广泛应用于生命科学研究中,以实现对细胞内蛋白-蛋白间的相互作用进行定时、定位、定量的无损伤检测。但在以前的研究中,该技术还是基本被用于对活细胞的体外实验,而我们今天介绍的这篇文章的意义就在与突破性的实现了该项技术在活体生物组织和胚胎水平研究中的运用。为了达到这个目的,作者利用了他们的目的分子Cdc42在体内被激活时会与CBD(Cdc42-binding domain)相互结合的特性并结合FRET的原理巧妙设计了两种生物探针。

Example

如图1所示,A为单分子探针,Cdc42与CBD以及各自所带的荧光蛋白被设计在同一条多肽链上。一旦Cdc42在体内被激活,则它与CBD会互相结合,而二者距离上的接近则为各自所带的荧光蛋白间的共振能量转移创造了条件。通过体外的紫外照射监控,Cdc42所带的蓝色荧光蛋白(CFP)会一直处在激发状态,所以Cdc未被激活时,整个体系释放蓝色荧光信号。而一旦Cdc被激活,随着其与CBD的结合,由于CFP的发射光谱与YFP的吸收光谱有很大重叠,CFP上的能量会被传递到与CBD紧密相连的黄色荧光蛋白(YFP)并使其处在激发态,从而整个体系释放黄色荧光信号。而通过对这种荧光信号变化的实时记录,就可以了解体内Cdc42蛋白被激活的准确时间和方位。此外,该体系还有另外一个优点,由于Cdc42与CBD在探针上以严格的1:1比例存在,所以通过检测荧光信号强度,还可以准确计算出Cdc42分子被激活的强度。而与之对应的B为双分子探针,Cdc42与CBD分别连同各自的荧光蛋白分别被设计在两条多肽链上。其作用原理与单分子探针一样,不过无法准确定量Cdc42蛋白被激活的强度,但它也有优势,它的探针更小,可以最大限度的降低人为因素对生物体系的影响。在这篇文章中,作者一方面使用性能更为突出的单分子探针分别从细胞、组织和整个胚胎水平实时记录了果蝇体内Cdc42激活模式和强度,另一方面同时使用更可靠的双分子探针做了Control,以确保结果的可靠性。

Example

图2便是果蝇整个胚胎(A)、气管(B)以及中枢神经系统(C)在不同时间点上Cdc42蛋白被激活的模式和强度图,蓝色代表未被激活,黄色和红色代表被激活。这样的实时精确记录可以为我们进一步了解该蛋白在果蝇整个发育过程中的信号转导模式和所涉及的功能做更深入的研究,从而最终实现从序列到功能的跨越。

不难想象,同样的技术可以推广到对其他重要蛋白的功能和调控网络研究上去,从而大大丰富和加深我们现有的对于基因功能的认识。其实,抛开科学意义不说,仅仅想想如此复杂的生命过程以如此美丽和生动的方式展现在我们的眼前就足以让我们激动不已了,我想这就是生命科学研究的美妙之处吧!:)

参考文献

1.Kamiyama D, Chiba A.(2009) Endogenous Activation Patterns of Cdc42 GTPase Within Drosophila Embryos.Science 324: 1338 - 1340.
2.Nalbant P, Hodgson L, Kraynov V, Toutchkine A, Hahn KM.(2004) Activation of endogenous Cdc42 visualized in living cells.Science 305: 1015 - 1019.

Sunday, February 22, 2009

Hide-and-Seek with Nature

写在前面的话

我的Blog 09年2月份好像还没更新过,原因有二,2月上半月,一个字,懒,在家待得乐不思科研,呵呵;2月下半月,还是一个字,忙,在实验室忙着做数据,连看文献的时间都没了,更别提写Blog了。这不行啊,咱承诺过,至少每月一篇吧,但又连翘几期N&S了,肚子里没货啊。那咋办呢?就随便谈谈科研感想吧,虽有灌水之嫌,但也是真情实感不是?:)

*******************************华丽分割线**********************************

Hide-and-Seek with Nature(与自然捉迷藏),恩,这个标题不错,先自我欣赏下,嘿嘿,以后大牛了写自传就用这标题,哈哈哈

现在的课题由年前的课题结果衍生而来,两个课题间过渡的逻辑再自然不过了。量变与质变,连续与飞跃,渐变与爆发,这委实就是自然界的通用秩序。怎么看,怎么自然,简直大自然,哈哈:)

可是呢,经过年后十来天的努力,随着研究的深入发现事情似乎没有那么简单。我们所设想的那种完美的秩序在这里似乎有些被动摇了,打散了。一度明晰的自然之律在这一刻由又重新变得越来越混沌,我也变得越来越迷茫,搞不清,搞不清啊。

科学的发现过程大抵都如此吧。证据-》假说-》实验验证-》结果不符-》修改假说-》继续验证...如此循环往复,步步逼近...

这不就是和自然捉迷藏嘛?咱这个概括还算准确吧?还算生动吧?而且富有童心吧?:P

今天实在被负面的数据结果搞得有些郁闷了,所以扯了这么多。不过想想也正常,咱的对手是自然啊,小爱同学都奉为God了,那玩起捉迷藏起来还能容易啊?

所以呢,今天晚上就看看球,堕落下。明天早起,舒活舒活筋骨,抖擞抖擞精神,继续和自然捉迷藏哈:P

Friday, January 09, 2009

Next-generation Sequencing Technique

当终于认识到核酸才是生命的遗传物质,明白了地球上一切生物的生老病死之迷都蕴藏在那AT(U)GC四个字母组成的浩瀚序列中之后,核酸(这里主要指DNA)测序技术的研究和开发便成了生物学研究的重中之重。上世纪70年代,随着Frederick Sanger的双脱氧法和Allan Maxam-Walter Gilbert 的化学降解法的发明,这一难题终于得到了根本性的解决。1980年,Sanger和Gilbert由于这一贡献,共同荣获Nobel化学奖。但DNA测序的故事到这里却远未结束。在接下来的30多年中,实现更长的测序片段长度和更高的测序反应通量成了众多生物学家、化学家乃至计算机学家、材料学家及工程师们不懈努力的目标。经过他们的努力,现在主流的Sanger双脱氧法测序的单个测序片段长度已经能达到1000bp,并且测序通量已经提升到了同时完成96个独立反应。但Sanger法测序依赖于电泳,而电泳设备(仅管现在使用的已经是毛细管阵列)的体积又限制了Sanger法测序向更高通量的发展。并且,Sanger法对测序样品的前期准备要求较高,并且这个准备过程步骤繁杂,难以自动化,费时、费钱、费人力。正是看到了Sanger法这些难以克服的瓶颈,研究人员们不得不放弃Sanger法,开始各显神通,另辟蹊径,寻找新的解决方案——第二代测序技术。这种新的测序方法应该有以下几个特点:高通量、高自动化、高精确度、低成本并且测序片段长度尽可能长。

最近几年,一些第二代测序方法相继取得突破。2005年,先行者454测序技术(现在已被Roche收购并推向市场)完成了对Mycoplasma genitalium全基因组的测定,这是世界上第一个由非Sanger法完成的全基因组测序。从这一刻开始,Illumina公司的Solexa技术,ABI公司的SOLiD技术,基于开源平台的Polonator技术,还有以单分子测序为目标的HeliScope和Pacificbiosciences公司的实时测序(Real-time Sequencing)技术相继映入我们的眼帘,看得我们眼花缭乱。下面,我就分别对传统的Sanger法以及第二代测序技术中的几个代表Roche 454、Illumina Solexa、ABI SOLiD,并且着重介绍个人觉得最华丽的Pacificbiosciences 实时测序技术。:P


传统测序方法

Sanger双脱氧法


如图1所示,a)首先将待测基因组序列打断成较短的DNA片段,以方便后面的处理。b)将所得的DNA片段连入质粒载体在E.coli体内扩增,使DNA片段得到富集。挑取单菌落分离纯化出其中的质粒用去测序。c)在反应体系中加入DNA聚合酶,dNTP以及带有荧光标记的双脱氧核苷酸ddNTP。由于ddNTP的链终止作用,使得对于每个片段的DNA模板,会扩增出一系列长短不一且3'端带有荧光标记ddNTP的核苷酸片段。当扩增出来的这种片段足够多的时候对于模板的每一个核苷酸位点都有相应的荧光标记3’端ddNTP与之对应。d)这样,我们通过毛细管凝胶电泳来分析这一系列标记过的核苷酸片段,收集每个位点上的荧光信号,通过软件处理,就可以得到高质量的DNA序列信息。我们前面说过,现在的Sanger测序仪采用96个毛细电泳管的阵列,可以同时进行96个这样的测序反应,每个反应得到的Read长度可以达到1000bp以上。


第二代测序方法

Roche 454 法


如图2所示,a)将待测基因组序列打断成较短的DNA片段,片段两端分别连接特定接头,并使双链熔解拆分为单链DNA分子。b) 利用直径为28µm的DNA吸附珠与单链DNA分子特定端接头的吸附作用吸附固定单链DNA分子(控制条件使每一个珠子仅吸附一条DNA单链分子),然后利用乳化PCR(emulsion-based PCR , emPCR)扩增每个珠子上的DNA分子拷贝数,以备下一步测序使用。c-e)将每个珠子置于隔离反应井中(每个反应井55 µm 深 ,直径44 µm )。f)Roche 454使用焦磷酸法测序,其反应原理是在DNA聚合酶、ATP硫酸化酶 ( ATP:sulfurylase 或 ATP:sulfate adenylyltransferase)、荧光素酶 ( luciferase)和三磷酸腺苷双磷酸酶( apyrase) 4种酶的协同作用下,将每一个dNTP的聚合与一次荧光信号的释放偶联起来。f)记录并分析这些荧光信号,就可以获得高质量的DNA序列。Roche 454法现在每次可以同时进行400,000个反应,每个反应得到的Read长度可以达到500bp左右。


Illumina Solexa法


如图3所示,a)将待测基因组序列打断成较短的DNA片段,片段两端分别连接特定接头,并使双链熔解拆分为单链DNA分子。b) 通过接头将单链DNA分子随机吸附在反应板表面,然后利用桥式 PCR(bridge PCR)扩增每个单链DNA分子拷贝数。通过这一步,同种单链DNA将成簇分布在反应板表面。c)加入改造过的DNA聚合酶和带有4种荧光标记(分别针对dATP,dTDP,dGDP,dCDP)和可变粘性3'端的dNTP。对任何一条模板序列,它在聚合1bp的核苷酸后由于聚合上去的dNTP粘性末端被封闭,将无法再聚合第二个核苷酸。此时,用激光扫描反应板表面,读取每条模板序列第一轮反应所聚合上去的核苷酸种类。加入试剂去除被聚合上去的dNTP的荧光基团,然后恢复3'端粘性,继续聚合第二个核苷酸。如此继续下去,直到每条模板序列都完全被聚合为双链。这样,联合统计每轮收集到的荧光信号结果,就可以得知每个模板DNA片段的序列。这种方法一次可以同时完成3000~6000万个反应,但每个反应的Read长度暂时只能达到30bp左右。


ABI SOLiD法

如图4所示,a)将待测基因组序列打断成较短的DNA片段,片段两端分别连接特定接头,并使双链熔解拆分为单链DNA分子。b) 利用直径为1µm的DNA吸附珠与单链DNA分子特定端接头的吸附作用吸附固定单链DNA分子(控制条件使每一个珠子仅吸附一条DNA单链分子),然后利用乳化PCR(emulsion-based PCR , emPCR)扩增每个珠子上的DNA分子拷贝数,以备下一步测序使用。将珠子随机吸附在反应平板上。c)采用一系列用荧光标记的寡核苷酸(8个核苷酸)探针,探针3'端的前2个核苷酸为测序反应提供信息。ABI SOLiD法与以上几种方法显著不同的是它使用DNA连接酶而非聚合酶进行测序反应。通过连接反应,不同的寡核苷酸探针与模板序列竞争结合,只有3’端前两个核苷酸与模板链相应位置完全配对互补的探针才会被连接到模板的互补链上,这样,通过多轮反应,模板链上位置编号为(1 or 2 +8N)的核苷酸位点的序列将被测定。然后将模板互补链的引物接头延长一个核苷酸,同样的采用连接酶进行多轮测序,则模板链上位置编号为(2 or 3 +8N)的核苷酸位点的序列将被测定,如此反复几次,就可以获得模板DNA分子的全长序列信息。由于采用了更小的吸附珠子,这种方法比Roche 454法拥有更高的通量,但每个反应的Read长度暂时只能达到35bp左右。



Pacificbiosciences 实时测序技术

如图5所示,a)将DNA聚合酶固定在直径为100nm的zero-mode waveguide(ZMW)上,通过对调节的控制,可以实现每个waveguide顶端表面仅吸附一个DNA聚合酶。ZMW的纳米结构为DNA聚合反应提供良好的反应隔离条件。b)为对四种dNTP的磷酸基团做不同颜色的荧光标记,然后让这些dNTP进行DNA聚合反应。这样,每一个被聚合到模板链的互补链上的dNTP都会释放出代表着这个种碱基的荧光信号,而且随着后一个dNTP的聚合反应,前面已经结合上去的dNTP分子的荧光信号会被猝灭。c)荧光信号通过ZMW被电脑终端所收集并进行详细分析,从而获得模板DNA分子的真实序列。该方法与前面几个方法的差别主要体现在不需要对DNA样品做富集化处理,这意味着前期准备工作会轻松很多。该方法是伴随着DNA分子聚合反应的实时测序法,其可靠性有很好的保证。该研究组发表在Science 2009年第一期上的文章表明他们的这种方法已经能将每个Read的长度扩展到1000bp,即可以媲美传统的Sanger测序法,而ZMW的nm级的规格将有助于大大提高测序通量以及实现测序仪小型化。另外,该技术对待测DNA样本的要求很低,不需要做前期扩增,因此大大提升了整个测序过程的自动性,拥有非常好的应用前景。虽然这项测序技术现在还没有被全基因组测序所检验,但相信很快就会有这方面的报道,并且很快实现产品商业化。

上面介绍了这么多种测序方法,到底那种最好呢?这个问题现在还不好回答。Roche 454商业化的最早,每Read的测序长度也比较长,但其通量仍有限,且测序成本现在还很高。Illumina Solexa和ABI SOLiD的测序通量很高,测序成本也较低,但每Read的长度太短,全基因组测序的话会有困难,除非有好的参考序列(reference)。我个人最看好的Pacificbiosciences 实时测序技术现在还没有完全成熟和商业化,因此还有许多未知数。 2008年7月,Archon X Prize Foundation宣布,如果哪个研究组使用第二代测序技术能在10天内实现对100个人的基因组完全测序,且每个基因组测序成本不高于10,000美元,他们将获得10,000,000美元的奖金。究竟那种技术会最终胜出,我们拭目以待。:P


参考文献

  1. M. Margulies, et al. (2005) Genome sequencing in microfabricated high-density picolitre reactors. Nature 437: 376–380

  2. D. Wheeler, et al. (2008) The complete genome of an individual by massively parallel DNA sequencing. Nature 452: 872–877

  3. J.M. Rothberg, J.H. Leamon (2008) The development and impact of 454 sequencing. Nature Biotechnology 26: 1117-1124

  4. J. Shendure, H. Ji (2008) Next-generation DNA sequencing. Nature Biotechnology 26: 1135-1145

  5. A. Boodhun, et al (2008) Accurate whole human genomesequencing using reversible terminatorchemistry. Nature 456: 53-59

  6. J. Eid, et al (2009) Real-time DNA sequencing from single polymerase molecules. Science 323: 133-138