若想创造出一个“合成生命”,必须解决两大难题。一个难题是宿主细胞中的限制性内切酶会摧毁被移植的基因组;另一个难题是生命对合成基因组的精度要求非常高。“甲基化”和高精度“桑格测序法”,让两大难题迎刃而解。培养皿中的“蓝色菌落”宣告了第一个人造细胞的诞生!正是因为这一成果,人们称文特尔为“人造生命”之父。
LIFE AT
THE SPEED
OF LIGHT
我们如果要解决以前从未得到解决的难题,那么必须走向未知领域。
——理查德·费曼
许多人认为,人类最重要的创新能力是某种极富远见的天赋,那是一种与牛顿、米开朗基罗、居里夫人和爱因斯坦这样的卓越而非凡的天才人物的名字联系在一起的天赋礼物。对这些伟人给人类带来的难以置信的影响,我从来不曾怀疑过。他们实现了巨大的智识飞跃,他们比以往任何一个人都要看得更加长远,普通人只能看到一些杂乱无章的东西,他们却能从中识别出某种模式。然而还有另外一类创造性,它们也能够推动科学的发展,却不太引人注目,这些不起眼的创新能力同样是重要的。这类创造性就是“解决问题的能力”。在许多情况下,跨越一个障碍去实现一个非常特定的目标,有可能会催生一种日后将被证明有许多其他用途的技术。确实,从一个非常“狭窄”的出发点起步的科学研究可能会被推进到一个非常大胆的新方向上去。
例如,当汉密尔顿·史密斯在细菌流感嗜血杆菌中发现了一种现在被称为限制性内切酶的蛋白质时所发生的事情就是这样。那么事情究竟是怎样的呢?我并不认为他当时就预料到他的发现将有助于奠定基因工程的基础。类似地,当英国遗传学家亚历克·杰弗里斯(Alec Jeffreys)在X光片上看到了一个模糊不清的图案时(这张X光片是他从研究助手那里拿来准备了解遗传物质用的),他怀疑这混乱的图像可能会为法医DNA科学铺平道路,但是我并不认为他当时已经意识到这个技术会逐渐被用于进行常规的亲子鉴定和研究野生动物种群,当然,还有刑事侦查等领域。当长崎原子弹爆炸的幸存者下村修(Osamu Shimomura)在1961到1988年间收集了大约100万个发光水母(维多利亚多管发光水母)以探索生物体发光的秘密时(那是因为一种名为绿色荧光蛋白的蛋白质),他根本没有想到,他将送给全世界一个通用的发光标签,这个标签能够为我们提供有关脑细胞是如何发育的以及癌细胞是如何通过组织进行扩散的生动画面。当我们遇到了一个阻碍了我们合成生命研究工作的难题时(从基因的角度看,研究合成生命就像是搞清楚如何在一台多功能计算机上运行个人软件),我们设计的解决方案也为我们带来了一份非常可观的红利,那就是,我们找到了一种以全新的方式处理大片大片的DNA的新方法。
无法绕过的两个难题
到2007年,我们已经成功地实施了基因组移植,同时也完成了把实验室化学物质组装成一个包含了582 970个碱基对的生殖支原体基因组的艰苦卓绝的工作。我们创造了一个合成细菌染色体,并已经成功地让它在酵母中生长。我们还能够纯化酵母中的染色体,以便它能够通过DNA测序得以确认。然而,我们利用酵母细胞的过程只是作为化学合成的基因组片段的最后组装过程的一种工具,这意味着我们有了自己的能够在真核生物(酵母)细胞中生长的原核生物(细菌)的染色体。为了完成我们合成细胞的构建工作,我们还需要把合成的染色体以一种允许它被移植到受体原核细胞中的方式从酵母中分离出来。
在这一点上,我们遇到了一些我们从未预料到的问题。第一个问题是关于合成染色体的构象问题。我们已经能够纯化线性的和环状的合成染色体以进行DNA测序,但是我们在基因组移植的具体工作中发现的证据表明,我们还需要完整的染色体,这意味着在DNA中不能有任何的切口或刻痕。我们的纯化方法太粗糙了,以至于无法给我们提供完整的DNA。这就相当于我们虽然创建了一个数字记录,但是这个数字记录却是不能被任何一个数字“玩家”有效读取的。
第二个问题是,当我们努力把我们的基因组移植工作扩展到另一个支原体物种(生殖支原体)上时,我们并没有获得成功。当我们把生殖支原体基因组移植回生殖支原体细胞中时,染色体总是与现有的基因组进行重组。而且,这并不是唯一的问题。正如我们已经非常清楚的那样,虽然生殖支原体拥有最小的基因组,但是它并不是开发新方法的理想有机体,因为它生长速度之缓慢实在令人沮丧。在菌落出现之前每个实验要花长达6个星期的时间。尽管如此,我们仍然奋力前行。虽然这些实验都在继续进行,但是由于我们在把丝状支原体基因组移植到山羊支原体细胞中的成功,我们决定使用这些快速增长的物种来解决从酵母细胞中获得完整染色体的问题。我们的第一步是想看看我们能否在酵母中克隆出完整的丝状支原体基因组。这个目标看起来似乎是可以实现的,因为我们已经在一个人造酵母染色体中成功地创造出了一个合成基因组。
我们把这个任务交给了格温·奔德斯,让他来应对这个挑战。他是一名博士后,与克莱德·哈奇森一起工作。在那个时候,通常的做法是,加入酵母着丝粒,让大DNA分子能够在酵母中稳定地生长。酵母着丝粒是基因组中的一个特殊区域,在细胞分裂过程中,当染色体形成了它们那种标志性的特有的X形状时,酵母着丝粒能够在染色体上的一个叫作主缢痕的皱缩区域上用显微镜识别出来。这个皱缩区域是染色体的联结点,它们扮演了一个关键的角色,能够确保当细胞分裂时每个子细胞都能够继承每一个染色体的副本。因此,一个着丝粒被加入到一个大的DNA片段中去后,当细胞分裂时,后者能够与酵母染色体一道被复制和分离。利用这种方法,我们能够培养出环状的染色体。通过在它们当中加入端粒(这是一种在染色体的终端被发现的结构),这个外来的(外生的)DNA分子能够被培养成线性的形状。
在这些早期工作的基础上,我们开发了三种不同的方法来在酵母中克隆完整的细菌染色体。在第一种方法中,把它放入酵母中培养之前,我们选择把一个人造酵母着丝粒插入到细菌染色体中。在第二种和第三种方法中,我们所有的事情都同时做:引进了具有重叠序列的细菌染色体和酵母着丝粒,这使得它们在酵母中进行重组。令人鼓舞的是,所有三种方法在一系列基因组中都获得了成功,包括丝状支原体基因组、流感嗜血杆菌基因组以及光合藻类基因组。特别有趣的是,把一个细菌染色体转换为一个酵母染色体唯一的要求是,添加一个伴有选择标记的小小的合成酵母着丝粒。现在,我们有了一个方法,可以用它来测试基因移植工作的多种不同方式。一旦我们拥有了能够在酵母细胞中稳定进行克隆的丝状支原体基因组,我们就开发出了一种能够用移植的方法来重新获得完整染色体的程序。
甲基化,合成基因组移植的关键
为了测试源于酵母的丝状支原体,我们像以前一样把它移植到了山羊支原体细胞中。然而,尽管这个实验已经尝试过无数次了,我们研究团队还是无法重新获得任何移植细胞。为此,他们在控制实验中使用了从野生型丝状支原体细胞中分离出来的丝状支原体基因组,这种基因组移植实验与先前所做的实验一样总是奏效。当他们在进行实验的时候,我自己则在另外的地方等待结果,最后,汉密尔顿·史密斯来见我,带来了一个毁灭性的“判决”,他告诉我:“要在酵母中完成基因组移植根本无法做到。”那个允许我们操纵的长长的细菌DNA片段的酵母似乎就是问题的源头。
史密斯和我在更早的时候就曾经讨论过,到底用什么东西才能够把在丝状支原体细胞生长的丝状支原体基因组与在酵母细胞生长的相同的基因组区分开来,因此当在罗克维尔的团队和在拉霍亚的团队之间进行视频会议时,我们迅速把注意力集中到了那些最明显的区别上。在丝状支原体细胞中,DNA是进行过专门的甲基化处理的(即用一种称为甲基原子团的分子标记进行了“装饰”),所用的这些源自甲醇的基团每一个都由一个碳原子和三个氢原子组成(CH3)。细菌细胞利用DNA甲基化来保护DNA不被它自己的限制性内切酶所切断,这是通过把甲基原子团添加到DNA碱基中完成的,这能够被限制性内切酶识别出来。然而酵母不具有相同的限制性内切酶和DNA甲基化系统,由于密码子的差异,细菌甲基化酶不太可能在酵母中被表达出来。我们推断,如果在酵母中丝状支原体基因组的确是未甲基化的,那么当我们把它移植入山羊支原体中时,宿主细胞中的限制性内切酶将立即摧毁被移植的基因组。
那么,在酵母中DNA甲基化的缺乏是移植失败的原因吗?我们开始尝试着用两种方法来验证这个想法。在第一种方法中,当它从酵母细胞中被分离出来后,我们克隆了六个丝状支原体DNA甲基化基因以产生酶来甲基化丝状支原体基因组。这种方法获得了成功,由于从酵母细胞中分离出来的基因组进行了甲基化,基因移植最终成功了。如果我们利用丝状支原体细胞提取物或者克隆和纯化DNA甲基化酶去使丝状支原体基因组甲基化,那么我们移植基因组到山羊支原体细胞中也可能同样会获得成功。正如最终的结果所证明的那样,关键的因素是DNA甲基化,我们把限制酶基因移除出了受体山羊支原体基因组,我们推断,如果受体细胞中没有限制性内切酶,那么我们应该能够直接从酵母细胞中移植裸丝状支原体DNA,而不需要进行保护性的甲基化。事实的确如此,终于,我们似乎拥有了移植合成染色体必需的所有组件。
上文中这些简短的叙述,并不能反映以下这个事实:实际上为了解决甲基化问题,我们经历了两年多艰苦卓绝的工作,但是在这个过程中,我们已经开发出了非常强大的一套新工具,它能够让我们以前所未有的方式来操纵细菌染色体。大多数类型的细菌细胞都不具有在酵母和大肠杆菌中被发现的遗传体系(诸如同源重组)。因此,在大多数细菌基因组中制造大量的遗传变化,即使不是不可能的,那也是非常困难的。这也是大多数科学家都利用大肠杆菌来进行工作的原因之一:他们之所以这样做只是因为他们只能这样做。
然而现在,通过把真核生物(酵母)的着丝粒添加到原核生物(细菌)的基因组中,我们就能够在酵母中培养出细菌基因组了,而且在那里它的“行为表现”就像一个酵母染色体。这为使用酵母的同源重组系统来使基因组发生大量的和快速的变化铺平了道路。然后我们就能够把修改后的细菌基因组分离出来,如果有必要,可以对它进行甲基化,并且把它移植到一个受体细胞中来创造一个新细胞。这标志着基因操作上的一大进步。在这一发现之前,科学家们在很大程度上被限制在只能对个别基因的修修补补上。现在,我们可以经常性地操纵一组基因组,甚至整个基因组了。我们的这一研究结果发表在了2009年9月的《科学》杂志上。
现在我们已经开发了一系列新方法来合成DNA,它们的规模比以前大了20多倍;我们也已经找到了有效的方法来把基因组从一个物种移植到另一个物种中以创造出一个新的物种;我们已经解决了限制性内切酶破坏移植DNA的DNA修改问题。接下来,我们和许多跟进我们研究进展的科学家可以着手搞清楚以下这个问题了:在合成基因组的基础上,我们是否最终能够成功地创造出一个细胞。既然现在我们已经证明,我们能够成功地把从酵母中培养出来的DNA移植到支原体上,那么很自然地,我们要做的下一步是把酵母中的合成DNA移植到支原体中去。我们打算综合运用所有这些新方法来创造历史。但是我们所使用的支原体是正确的吗?
由于我们在利用酵母来操纵巨大的DNA片段方面已经取得了很大进步,因此我们的团队仍然顽强地继续试图移植合成生殖支原体的基因组,但结果不是很成功。尽管看来似乎我们可以通过移植原生基因组把较大的肺炎支原体转变为生殖支原体,但是在利用合成基因组时,我们无法获得相同的结果。最后我们发现,受体肺炎支原体的细胞表面含有一个核酸酶,它能吞噬消化掉了任何一个暴露在外的DNA。
但是,我们仍然继续为生殖支原体细胞极端缓慢的增长速度所困扰,这极大地限制了我们所能完成的实验数量。对我们所有人来说,尤其是我,要得到结果必须等待数周不仅仅是令人沮丧的,而且还是非常痛苦的,我们必须改变这种情况。虽然我们在DNA甲基化和移植方面取得了一些进步,但是我们还必须想出了一个更快的方式来创造合成DNA,技术上的创举会为我们追求移植合成细菌DNA提供新的机遇。正如我在本书前面的章节中已经描述过的那样,我们DNA合成的最初阶段,需要分好几个步骤完成,例如,首先要把短的寡核苷酸组装成更大的结构。而丹·吉布森极大地简化了这种方法,以至于我们要完成这个过程只需要一个步骤就够了。
丹·吉布森所使用的DNA组装反应新方法与我们早期工作时所用的方法非常类似。不同之处在于,他得到了一个重要发现,从而使我们可以把所有的DNA都放入一个试管中并在一个单一的温度下进行合成。丹·吉布森意识到,能切断DNA一条链的核酸外切酶不会与我们用来填补缺失DNA碱基的DNA聚合酶相竞争。另外,在50℃的温度下,当所有的酶都聚合在单个反应中时,核酸外切酶在这个温度下会迅速失活,因此它只能消化掉刚好足够的碱基,从而允许DNA片段彼此“退火”。
与我们先前的方法相比,这项工作代表一个极大的进步,我们先前的方法不仅繁琐,而且是劳动力密集型的。我们把这种新方法称为“吉布森组装法”,它的威力就在于它十分简单。在此之前,我们一直不愿意去认真考虑这种可能性:重复我们当初从一万个DNA片段中创造出第一个合成染色体生殖支原体JCVI-1.0时的做法,因为那是一种马拉松式的无比艰辛的工作,更不要说去尝试其他任何更大的东西了。一开始,我们就认为基因合成的化学过程是我们所要解决的最棘手的问题;但是现在,合成技术的开发给了我信心,我们决定对这个项目在方向上进行重大调整。
为此,我与史密斯进行了讨论,我说,我们在前面的工作中选择了错误的方法。原因很简单,我们利用生长如此缓慢的生殖支原体很可能永远也不能取得成功,现在我们更像垂死挣扎。我告诉史密斯:“我希望我们能够停止目前所做的一切工作,利用新技术来合成丝状支原体基因组。”当然,这是一个艰巨的任务,因为丝状支原体基因组是生殖支原体基因组的两倍大。但在那个时候,我们已经知道如何从酵母中移植丝状支原体基因组了,我们也知道如何在山羊支原体细胞中制造出丝状支原体细胞了;而且,有了“吉布森组装法”,至少从理论上看,我们应该已经有能力相对较快地构造出一个拥有110万个碱基对的基因组了。
提出这个新方案之后,一开始我遇到了来自研究团队的强大阻力,现在回想起来,当时大家有这种抵触情绪其实并不令人感到特别惊讶,因为这种激进的新方法不仅要另起炉灶,而且还瞄准了一个更加雄心勃勃的目标。不出所料,丹·吉布森同意我改变计划,而史密斯和研究团队的其他成员则希望沿用原来的思路,他们认为,老方案已经驾轻就熟了,而且需要解决的问题也已经很明显了,因此不如继续使用生长缓慢的生殖支原体细胞,同时着眼于寻找新的思路来解决这些问题。然而,经过几轮讨论,当每个人都对我的想法进行了足够长时间的深思熟虑后,他们思想开始发生改变了。史密斯跑过来见我,同意我们改变方向;我们立即打电话给丹·吉布森,告诉他着手开始合成丝状支原体基因组。
我们的团队成员最初反对这种新方案的其中一个原因是,我们还没有一个丝状支原体基因组的精确基因组序列。但是这其实不是问题,当我们很快完成了两个菌株(隔离群)的测序后,就开始设计和合成基因组了。我们从这两个丝状支原体隔离群中分离出来两个基因组序列,彼此之间在95个序列点上存在差别。因为如今酵母在组装合成基因组中发挥了重要作用,所以我们选择的是这样一个隔离群的基因组序列:我们曾经成功地在酵母中将这种基因组序列克隆出来,并且移植到了受体细胞中。
我们首先设计了1 078个“卡带”,其中每一个卡带都有1 080个碱基对,而且在其相邻部分有80个碱基对是重叠的。为了使我们能够从它们生长的载体中切出要组装的序列,我们给“卡带”添加了8个碱基对的序列,作为切位点让限制性内切酶“诺蒂”据以识别。我们还添加了4个水印以帮助我们把合成基因组与发生在物种内的天然基因组区分开来。水印被添加在从1 081~1 246个碱基对的范围内,它包含一个独特的代码,旨在让我们用英语来写数字和单词。我们小心翼翼地把水印序列插入到基因组区域内,我们已经用实验表明,这并不会影响细胞的生存能力。在完成了设计阶段的工作后,我们向蓝鹭生物技术公司(Blue Heron)订购了1 078个“卡带”,蓝鹭生物技术公司是一个比较早就创立的DNA合成公司,总部设在华盛顿州的巴塞尔。这个公司用化学合成的寡核苷酸“组装”好了这些含有1 080个碱基对的片段,并对它们进行了测序以确保它们符合我们所要求的规格,然后把它们运给了我们。
现在我们可以开始认真地构建合成生物体了。我们使用了一种分层构造法,它可以分为三个阶段。首先,我们采用“吉布森组装法”,利用这些包含有1 080个碱基对的“卡带”构造出了111个更长的“卡带”,每个“卡带”都有大约1万个碱基对。与以往一样,准确性是至关重要的,所以我们测序所有这111个“卡带”,在其中19个“卡带”中发现了错误。我们纠正了这些序列错误,然后对这些1万个碱基对的克隆体进行了重新组装和重新排序,以确定它们是否正确。
在基因组组装的第二轮中,我们对这些1万个碱基对的“卡带”以重叠方式进行组装,形成了一些拥有10万个碱基对的“卡带”(我们同样也对它们进行了测序以检验准确性)。最后,我们在酵母中把这11个包含有10万个碱基对的“卡带”组合到一起,得到了包含有110万个碱基对的丝状支原体基因组的序列。当然,我们又一次不得不去验证我们的组装是否有效,并用聚合酶链式反应和限制性内切酶消化作用来确认我们是否得到了正确的基因组结构。
生死之间:一个碱基对的对错
最后,我们准备尝试着通过把完整的合成丝状支原体基因组从酵母中移植到受体山羊支原体细胞中以创造第一个合成细胞。和以前一样,成功的标志是蓝色细胞。我们做第一次移植实验是在一个星期五,整个周末我们都是在焦虑中度过的,我们很想知道,到下个星期一早晨是否会有蓝色的克隆体出现。但是,星期一来了又去了,我们想要的积极结果却没有出现。在接下来的两个星期五,我们都重复了移植实验,但是再一次,没有蓝色的克隆体,而只有“蓝色”的阴郁星期一4。
现在回想起来,很显然当时我们已经非常接近成功了,只是在当时我们自己没有意识到而已。在考虑了所有控制因素后,我们确信,在基因组合成期间,我们在检验准确性时肯定有什么设计上的或程序上的错误被我们忽略了。因为我们已经对DNA进行了测序,因此我们猜想,错误必定发生在用于基因组设计的其中一个最初序列里。为了检查我们的代码,我们必须开发出一个生物学上的代码调试工具,它类似于计算机应用程序开发者眼中的调试软件。我们现在所使用的任何一台现代计算机都有一个非常庞大的操作系统,它运行着数千万行代码,几十年来,计算机行业的工程师们已经开发出了许多非常有效的智能调试程序来帮助寻找代码错误。
弗拉基米尔·N.诺斯科夫是马里兰州J.克雷格·文特尔研究所合成生物学与生物能源组的一名科研人员,他也是我们的常驻酵母大师。诺斯科夫毕业于俄罗斯圣彼得堡国家大学,然后继续在那儿获得了酵母遗传学博士学位。他在日本留学5年,研究染色体DNA的复制和酵母细胞周期内的“检查点”,DNA的监测和修复工作就是在“检查点”内执行的;后来,他还曾经在贝塞斯达的美国国家卫生研究院工作过。在我们这个研究项目中,诺斯科夫加入了染色体结构和功能研究小组,在那里,他为在酵母中操纵大块的DNA技术开发出了多个非常有用的应用程序,这种技术被称为“转化介导重组”(transformation-associated recombination, TAR)克隆技术,它比那些依赖于一种叫作酵母人工染色体的传统方法更有优势。
在运行我们的“生物学调试程序”时,我们决定从验证这11个含有10万碱基对的片段开始。诺斯科夫利用转化介导重组克隆技术,从原生丝状支原体基因组中构建了同等大小的片段,因此每个片段我们都能够独立地用合成片段来代替,这样就可以搞清楚它们是否能够支持生命。从这些复杂的实验当中,我们发现,在这11个10万个碱基对的合成片段当中,除了一个之外,其他的都是与生命相容的。为了取得最后的证据,丹·吉布森构造了一个由10个合成片段和一个原生片段混合而成的混合基因组,并且成功地进行了移植。
在确定了哪个片段包含有不支持生命的错误后,我们再一次进行了DNA测序,这一次我们采用的是高精确性的桑格测序法,结果我们发现,这个错误的片段少了一个碱基对。从表面上看,这个错误似乎就像是把“mistake”(错误)写成了“mistke”这么简单,但是,把核苷酸基字母代号等同于通常的单个字母这种做法是误导人的,这是因为,就一次读取三个核苷酸基的DNA代码而言,每一个三联体或者密码子,都对应于蛋白质中的一个氨基酸。这就意味着,只要出现了单个碱基的缺失,就能够有效地转换跟在它后面的基因句子中的其余部分,从而也就改变了基因句子中的氨基酸序列。这就是所谓的“移码突变”(frameshift mutation);在我们这个例子中,移码发生在必需的基因脱氧核糖核酸A上,这导致在复制起始点上DNA的解旋,因此在复制开始时,它允许制造出新的基因组。单个碱基的缺失阻止了细胞分裂,从而使生命的创造变成了不可能的任务。现在,我们既然已经找到了这个严重的错误,我们就能够正确地重组这10万个碱基对的片段,并能够利用酵母去重组整个基因组了。我们现在已经准备好再次尝试做基因组移植实验了。
奇迹出现:第一个有生命的合成细胞
和以前一样,这个重要的实验仍然放在星期五开始,这样在下个星期一到来之前,任何一个移植成功的克隆体都有足够的时间成长起来,并且以蓝色圆点的形式呈现出来。丹·吉布森给我们大家发了封电子邮件来报告最新实验的情况,邮件内容如下:
文特尔、史密斯、哈奇森和约翰,完全合成的基因组(有四个水印,而且无dnaA突变)的移植工作今天已经完成了。这个基因组看起来非常不错。我们对11个接合点的每一个以及四个水印序列都通过多重聚合酶链式反应进行了分析。我们还利用限制性消化作用和电场倒转凝胶电泳(FIGE)对它进行了检查。与此同时,两个包含有10/11半合成基因组的酵母克隆体也正在被移植。我们对这些基因组也进行了上面的分析,看起来也非常不错。我会在下星期一早晨再发一封电子邮件给你们,但是请记住,克隆体通常会出现在比较晚一些的时间,因此在下星期二之前我们无法得到确切的答案。
那天下午,丹·吉布森把一个小小的瓶子递给了他的同事马力(Li Ma),马力正坐在一个生物安全罩前面,这是我们在无菌条件下做实验时所使用的一种密封的、带有高效空气过滤器的工作空间。瓶子里装有一个小小的琼脂糖插头,在这个琼脂糖插头中嵌入了几百万个可用显微镜观察到的环状DNA染色体,每个染色体都与我们的1 078 809个碱基对的合成基因组相一致。这就是为丝状支原体的886个基因以及我们的水印进行编码的合成DNA。马力加入了几滴酶,溶解了凝胶,只留下合成基因组,然后把它加入到含有受体山羊支原体细胞的第一个小小的瓶子里,接着利用聚乙二醇让细胞膜变得可透过DNA。接下来,他又把细胞散播于一个装有红色琼脂的培养皿中,这是一种用糖和氨基酸来培养新细胞的方法。琼脂中还夹杂有四环素以杀死任何没有接受合成基因组的受体细胞,以及把含有移植基因组的新细胞变为宝蓝色的X射线。当天傍晚,马力把培养皿放进了保温箱中以使细胞一直处于37℃的恒定温度之下。如果有任何新的细胞产生,那它们就需要几天的时间来进行足够多次的分裂以产生100万个子细胞,到那个时候,仅凭肉眼便可看见这个小菌落了。
整个周末我都非常焦虑。让我们看到我们的基因组修改是否成功的那个时刻似乎是那么遥不可及。最后,在星期一的清晨,丹·吉布森满怀希望地打开了保温箱的门,开始一个接一个地移出培养皿。为了把希望留到最后,他从控制培养皿开始打开(这些培养皿可以证明马力遵循了正确的程序),它把每一个培养皿都举到灯光下看看是否有肉眼可见的菌落。接着,他开始看那些含有合成DNA的培养皿。在那里,就在其中一个培养皿的偏离中心的一点点的地方,出现了一个散发着幽幽蓝光的细胞菌落,而且只有那一个。
丹·吉布森停了下来,感受那意义非凡的一刻。在盯着培养皿看了几分钟后,他把所有的培养皿全都放回了保温箱,然后在凌晨4点钟的时候给我发了一个简短的信息。信息内容如下:“我们有了一个蓝色的移植细胞。”我们走过了如此漫长的道路,遭遇了无数次的失败,经过了那么多年的不断试错,反复解决问题努力创新,在这一刻,我们所有的努力终于得到了回报。
当罗克维尔的实验出结果的时候,我正待在位于弗吉尼亚州亚历山大港的联排别墅里,因此我与丹·吉布森处于同一时区。紧接着我们进行了一系列的交流。丹·吉布森又给我们发了一封电子邮件:“到目前为止,已经有了由完全合成的基因组移植而引起的一个或两个蓝色菌落了!现在还太早,我们还无法得到有关移植数量的准确计数,但是我相信这个数字会比较高。我们将在今天晚些时候再看看,到明天再做一个最终统计。”我们需要验证的是,这个蓝色菌落是否只包含了合成的DNA。我告诉他,我会在上午10点去研究所,然后我又问他,第一次验证的结果需要多长时间才能得到。
我带上了摄像机,当我走在通往罗克维尔的乔治·华盛顿纪念公园路时,还顺手买了几瓶香槟。我一到达那儿就直接去了移植室,在那里我遇到了丹·吉布森,丹·吉布森喜不自胜,已经被团队的其他成员团团围住了。非常兴奋地与大家握过手后,丹·吉布森把我带到了保温箱前,从中掏出了培养皿给我看了第一个蓝色菌落。我们拍了一些照片,然后把这个有可能孕育出含有一个完整的合成基因组的第一个生命形式的培养皿小心翼翼地放回了保温箱中去。
当天晚些时候,我们第一次确认了培养皿中的合成基因组的信息:“恭喜你!这是正式结果!你已经成了第一个合成丝状支原体细胞的父亲!为你自己自豪吧!”我把在罗克维尔的所有团队成员都召集在了一起,并且与在拉霍亚的合成基因组团队的其他成员进行了视频通话。我相信拉霍亚团队应该也有足够多的冰镇香槟来进行庆贺。尽管最终结果的确认还需要再等待几天的时间,但是我们大家还是兴高采烈地举杯庆祝了这个显著的成功。
丹·吉布森在星期二上午的7:45给了我们发了第一个确认信息:“好消息!在单一合成基因的移植中,所有4个水印序列在多重聚合酶链式反应中都显示了出来。水印没有显示在野生的细胞和山羊支原体没有菌落的阴性对照中。”4月1日,即星期四,丹·吉布森又通过电子邮件给我们发来了第二轮实验的结果:“完整的合成基因组再次被移植成功了。这一次,它产生了大量的菌落!另外,第二个合成基因组克隆体也产生了大量的菌落。我现在要把‘生日快乐’气球移到移植室中去了。”
就在第二天,我们得到了更进一步的确认信息,这是唯一一个控制了新细胞的合成基因组:“特大好消息!当用AscI和BssHII去消化时,合成移植产生了预期的限制性片段。”被这些限制性内切酶切断的位点已被添加到了4个水印序列的3个中。4月21日,我们已经得到了活的合成细胞的DNA测序结果,此时已经没有任何值得怀疑的地方了:这个细胞已经完全被我们设计和合成的基因组所控制了。它的序列显示,在我们的基因组中有1 077 947个碱基对,正如我所预期的一样,包括预料中的与原生基因组的19个差异以及4个水印序列,这是证明这个DNA是合成的一个关键部分。正如我们曾经猜测过的那样,在DNA的100多万个碱基对中,仅仅缺失了一个字母就造成了有生命和无生命的天壤之别。我想再也没有什么东西能比这更能戏剧性地说明信息在生命中所扮演的核心角色了。
我们曾经投入了大量的精力来设计水印以确保我们能安全地为DNA序列中的复杂信息进行编码。在第一个合成基因组中,我们使用了三联体密码子编码氨基酸的单字母缩写来代表英文字母表中的字母。例如,氨基酸蛋氨酸指定遗传密码的三联体是ATG,我们用字母M作为它的缩写。但是由于氨基酸代码的范围更大,如果仅用字母表中的26个字母是不够表示的。所以我们设计了一个更完整的系统,它能够让我们对整个英文字母表与标点、数字和符号一起进行编码。(ABCDEFGHIJKLMNOPQRSTUVWXYZ[NEWLINE][SPACE]0123456789#@)(-+\=/:<;>$&}{*]%!'。,分别代表了TAG, AGT, TTT, ATT, TAA, GGC, TAC, TCA, CTG, GTT, GCA, AAC, CAA, TGC, CGT, ACA, TTA, CTA, GCT, TGA, TCC, TTG, GTC, GGT, CAT, TGG, GGG, ATA, TCT, CTT, ACT, AAT, AGA, GCG, GCC, TAT, CGC, GTA, TTC, TCG, CCG, GAC, CCC, CCT, CTC, CCA, CAC, CAG, CGG, TGT, AGC, ATC, ACC, AAG, AAA, ATG, AGG, GGA, ACG, GAT, GAG, GAA, CGA, GTG)。这些密码是水印解码的关键。第一个水印包括有“J.克雷格·文特尔研究所”和“合成基因组公司”,几位科学家的名字以及信息“通过给我们发电子邮件的方式(邮箱地址:MROQSTIZ@JCVI.org)向我们证明你已经解码了这个水印”。因为第一个活的能进行自我复制的物种是把一台计算机当作它的父母的,所以它必须要有自己的电子邮件地址。
我们在第一个合成基因组中没有加入任何有明显意义的信息,这是因为受到了可以使用的氨基酸代码的限制,现在,随着新代码的产生,我决定引用一些来源于文学作品的贴切语句或段落来标记这个历史性的时刻。我找到了三条,我觉得它们都非常有意义,而且也与第一个合成生命形式密切相关。第一段引语可以在第二个水印中找到:“去生活,去犯错,去跌入低谷,去取得胜利,去在生命中创造出生命。”当然,这句话来自詹姆斯·乔伊斯(James Joyce)的小说《一个青年艺术家的画像》(A Portrait of the Artist as a Young Man)。第三个水印包括了几位科学家的名字,还有这样一句名言:“我们看事物,不在它们本身是什么,而在于它们可能是什么。”这句话被认为是“曼哈顿计划”的物理学家J.罗伯特·奥本海默(J.Robert Oppenheimer)早年的一位老师说的,引自于奥本海默的传记《美国的普罗米修斯》(American Prometheus)。第四个水印中则包含了另外46位科学家的名字和诺贝尔奖得主、量子物理学家理查德·费曼(Richard Feynman)所说的一句话:“我无法创造的事物,我就无法理解。”
我们如今完成的这件事情,如果放到15年之前去看,可能会被认为是一个荒诞不经的梦。不过,从另一个角度来看,我们只是兜了一圈,又回到了原点。从细胞中的DNA开始,我们学会了如何准确地读取DNA序列。我们通过将四个字母的化学模拟代码(A, T,C, G)转换为计算机的数字代码(1和0)成功地“数字化”了生物学。现在我们已经成功地走向了另一个方向,从计算机中的数字代码开始重新创造DNA分子的化学信息,然后反过来,当然与以前任何东西都不同,又创造了没有任何自然历史的活的细胞。
我们的基本假设是(至少大部分分子生物学家都是这么认为的),在计算机中通过字母序列所表示DNA和基因组就是生命的信息系统。现在,我们已经从计算机中的数字信息开始,实现了这个回路的闭合,并且通过只使用这个信息,化学合成和组装了一个完整的细菌基因组,这个基因组还被移植到了受体细胞中,结果产生了仅由合成的基因组控制的一个新细胞。我们把这个新细胞命名为丝状支原体JCVIsyn-1.0。然后,我们开始撰写文章,准备公开发表我们的研究成果。
在2010年4月9日那一天,我与24位联合作者把我们的论文手稿投给了《科学》杂志。在论文被接受之前,也即我们投稿的一个月之后(5月13日),我们向几位白宫官员、国会议员和来自几个政府机构的一些官员做了一个简短的报告。
我们这篇论文被《科学》杂志在线发表的时间是2010年5月20日(正式发表的时间则为当年7月2日),世界各地的媒体都聚集到了华盛顿来参加我们的新闻发布会。《科学》杂志的编辑们与我们一起向世人宣布了第一个功能性合成基因组的诞生。史密斯向媒体解释说,我们现在已经拥有了分析细胞指令以确定它真实工作方式的方法。我们还谈到了我们更大的愿景,那就是,毫无疑问,我们在完成这项研究工作过程中所获得的知识,终有一天必定会通过开发许多重要的应用技术和产品给社会带来积极的结果,这些应用技术和产品包括生物燃料、药物、饮用水和食品,等等。当我们宣布这个消息时,我们实际上已经开始着手研究如何生产疫苗以及创造能够把二氧化碳转化为燃料的合成藻类了。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。