第一个基因组的合成
文特尔把第一个合成基因组的目标瞄向了生殖支原体。这种生命体的基因组拥有582 970个碱基对,合成的精确度要求是每10万个碱基对中的错误少于一个。完整基因组的组装是在酵母细胞中进行的。实验证明,有17个细胞包含了完整的生殖支原体基因组,甚至连插入的水印“文特尔研究所”都清晰 可见!
LIFE AT
THE SPEED
OF LIGHT
当前的机器之于未来相当于早期的蜥蜴之于人类。
——塞缪尔·巴特勒
20世纪70年代,保罗·伯格、赫伯特·伯耶和斯坦利·科恩开始切割和拼接DNA,这是DNA重组的早期阶段。自那之后,人类掌控生命的实验已经取得了很大的进展。就在20世纪70年代末期,大肠杆菌的实验室菌株已经能够完成基因改造,生产出人类胰岛素了。从那时起,科学家们成功地“诱导”细菌生产人类凝血因子用以治疗血友病、制造生长激素用以治疗侏儒症。在农业方面,人类已经能够对植物进行DNA改造,以增强植物的抗旱、抗虫害、抗除草剂和抗病毒的能力,从而大大提高了它们的产量和营养价值;改造植物的基因,能够让它们制造出塑料,还能减少以矿物燃料为基础的肥料的使用。同时人类也试图改造动物的基因以提高肉类产量、生产出人类疾病的“模型”,制造出诸如抗凝血剂之类的药物,生产出“人乳化”的牛奶以及制造出可移植到人身体上的猪器官。基因改造后的细胞已被用于制造各种各样的蛋白质,包括从抗体到能够提高红细胞产量的红细胞生成素。一些患者已经采用过基因疗法,在治疗过程中为患者的基因打上一个软件“补丁”,从而对他们的基因进行改造,以此来治疗一些遗传性疾病,比如免疫缺陷、失明和先天性的地中海贫血,等等。
遗传工程学发展到今天,已经完全可以称为合成生物学了。分子生物学和合成生物学之间的区别是模糊不清的,并且我们在日常使用过程中实际上都是不加区分的。只是“合成生物学”这个术语听起来更为“性感”。同样的,“系统生物学”已经取代了“生理学”,还有一些古板的化学家喜欢把它们称为“纳米技术”。无论你怎么称呼它,全球各地的大批科学家都在运用将生物学与工程学结合起来的方法从事基因工程的研究了。
近来取得的成就实在太多了,我们无法详细地一一加以描述,但是在这里,我们还是要列举一些基因工程方面的进展。2002年,分子生物学实验室的“主力军”大肠杆菌被威斯康星大学的弗雷德里克·布拉特纳(Frederick Blattner)部分地缩短了(大肠杆菌基因的15%被切除了),实验的目的是,被切除后的大肠杆菌基因组将成为更加可靠的工业化生产的基础。在哈佛大学,乔治·丘奇(George Church)的实验室开发出一种名为多重自动基因工程(MultipleXAutomated Genome Engineering, MAGE)的细胞编程新方法,成功地更换了32种大肠杆菌菌株的密码子,他们还计划在大多数被替换了密码子的大肠杆菌菌株内诱使那些部分被修改了的菌株沿着一条指定的演化途径生成单一细胞系。在麻省理工学院,克里斯托弗·沃伊特(Christopher Voigt)的实验室里安装了一个复杂的基因电路,如果把这种基因电路安装在细菌上,它就能够探测到四种不同的癌症指标,并且能够释放出杀死所有这四种癌细胞的因子。沃伊特的同事蒂莫西·卢(Timothy Lu)已经开发出了能够执行逻辑运算的DNA模块,这样一来,这些具有决策能力的可编程细胞就可以量身定制地应用于各种类型的程序。随着技术的进步,人类的目标也已经变得更加雄心勃勃,因此也就提出了更多的新问题,而这反过来又促进了进一步的技术进步。
目标:合成582 970个碱基对
如前所述,我们提出的研究计划是理解生命所必需的基因,而这就需要合成活细胞的基因组,但是要完成这一步,还需要先实现可观的技术进步。为了迎接挑战,我们需要利用各种各样的技能,正如我们早些年在人类基因组测序中获得成功时所做的一样。现代科学的成功越来越依赖于良好的团队合作。为了创造一个合成细胞,我们启动了三个主要项目。基于我们在phiX174上的研究,我们一致认为,如果我们想要获得成功,我们的研究工作重点应该首先集中在DNA合成这个领域上。因此我们的第一个团队是基因合成团队,它的任务是合成完整的细菌染色体。这个团队由汉密尔顿·史密斯领导,团队成员包括丹·吉布森、圭内斯·A.奔德斯(Gwyn A.Benders)、辛西娅·安德鲁斯—泼凡科治(Cynthia Andrews-Pfannkoch)、叶夫根尼娅·A.杰尼索娃(Evgeniya A.Denisova)、霍利·巴登—蒂乐森(Holly Baden-Tillson)、舍里·扎维里(Jayshree Zaveri)蒂莫西·B.斯托克韦尔(Timothy B.Stockwell)、阿努什卡·布朗莉(Anushka Brownley)、戴维·W.托马斯(David W.Thomas)、米克尔·A.艾尔格尔(Mikkel A.Algire)、查克·梅里曼(Chuck Merryman)、杨磊(Lei Young)、弗拉基米尔·N.诺斯科夫(Vladimir N.Noskov)、约翰·I.格拉斯(John I.Glass)和克莱德·哈奇森。我确信,化学方面的问题是完全可以解决的,我更关心的是生物方面的问题。我关心的是,如果成功地合成了一个细胞,那么我们能不能移植并“启动”这个合成基因组,我们是否能够对“哪些基因是最小的生命所必需的”这个问题有更多的理解?因此,我们的第二个和第三个研究团队都集中在生物学的研究上。第二个团队是基因组移植团队,它的负责人是约翰·I.格拉斯,团队成员包括卡罗拉·拉蒂格(Carole Lartigue)、尼娜·阿尔佩罗维奇(Nina Alperovich)、伦伯特·皮珀(Rembert Pieper)和普拉尚斯·P.帕尔马(Prashanth P.Parmar)。第三个团队是最小基因团队,由格拉斯和克莱德·哈奇森领导,团队成员包括奈拉·阿萨德—加西亚(Nacyra Assad-Garcia)、尼娜·阿尔佩罗维奇、石埠·约瑟夫(Shibu Yooseph)、马修·R.刘易斯(Matthew R.Lewis)和马希尔·马鲁夫(Mahir Maruf)。虽然这三个研究团队在成员上有所重叠,但是每一支团队研究方向都是高度专注的。史密斯、哈奇森和我是全部项目的领导人;当位于拉霍亚的J.克雷格·文特尔研究所建立起来后,史密斯和哈奇森便搬迁到了西部,而格拉斯则在罗克维尔市承担了全面的领导责任。
我们的计划是合成一个目前已知的最小的基因组,即能够组成一个活的自我复制的细胞的生殖支原体的基因组。我们的想法是,DNA的合成将是最大的挑战,它会为我们提供进一步缩减小型基因组的方法,从而使我们能够解释和剖析一个简单细胞的遗传指令集,这样一来,我们就可以“看到”和理解生命的最小基因组了。为了合成基因组,我们把生殖支原体基因组切割成101个被我们称为“卡带”的片段,每个“卡带”的大小大约与phiX174基因组的大小相当。我们知道,我们能够在5 000~7 000个碱基对片段中准确地制造出合成DNA,我们的计划是找到一种方法将它们结合起来以重建生殖支原体基因组。这个拥有582 970个碱基对的生殖支原体基因组比之前曾经合成过的任何东西都要大至少20倍。在我们做这次尝试之前,最大的人工DNA合成体是包括了两个小病毒和一个由32 000个碱基对组成的“聚酮化合物基因簇”。聚酮化合物是由细菌、真菌、植物和海洋生物等自然生产出来的、用来捕杀天敌的环状化学品,它已被用于制成许多药物,尤其用于制造抗生素和抗癌剂。
准备高精度的DNA序列数据
我们需要的是开发出一种新的工具来可靠地合成很大的DNA分子。工具和技术开发是科学进步的心脏,但是在我看来,一个很高的科学标准同样是必不可少的。我常常把基因组学的实验室工作描述为一个“垃圾进和垃圾出”的过程,这就像我们经常进行的计算一样,如果整个计算过程中,有某一步没有付出努力,那么计算结果就不可能是高质量的。在20世纪90年代,当我们对第一个基因组进行测序的时候,我们发现,如果我们的DNA库(包含了基因组的小片段)不是一个最高质量的基因库,而且在重要的基因组中无法实现所有DNA的随机分配,那么让计算机使用从这些基因库的样本中生成的序列来重构基因组序列就是完全不可能的。这样的高标准同样也适用于测序的DNA的质量、试剂的纯度和技术的可重复性。所有这些都必须是最高标准的。我的研究团队特别注意这些基础性的东西,因此我们始终都能够产生质量非常高的DNA序列数据。
然而,正如我们在本书第4章中已经讨论过的,读取遗传密码所必需的DNA序列数据的质量标准要远远低于写入一个能够支持生命的密码所必需的DNA序列数据。对于读取基因密码来说,目标通常设定为每一万个碱基对中的错误少于一个。虽然这听起来像是一个非常低的错误率,但是如果我们使用这个标准,那就意味着在生殖支原体基因组中将会出现60个错误的序列,而在人类基因组中则会出现超过6万个错误的序列。很显然,这种有错误的基因数据是不太可能支持生命的,同样也不可能为准确测定与疾病相关的人类基因的变异提供高质量的序列信息。一个典型的人类基因可能遍布于数以百万计的碱基对中,所以当前这个错误率(万分之一)就意味着每个基因都会出现不止一个序列错误。在这种情况下,在一个基因中的单个错误就有可能导致严重的疾病,比如血液疾病中的镰状细胞性贫血。出于同样的原因,这个错误率也是不可能保证我们在最低限度上重组基因组以创造出一个活的细胞的。
但是,这些简单的事实往往在妄想通过基因组测序以复活已经灭绝的物种的讨论中被忽略掉了。不管是否是因为受到了结合基因组学的鼓舞,斯万特·帕博(Svante Pääbo)主持的关于尼安德特人基因组测序,或者宾夕法尼亚州立大学的科学家进行的对猛犸象的DNA的测序,都已经引起了极大的关注,而且一般情况下,新闻炒作最终都会导致关于复活已经灭绝的物种的狂热幻想。我已经看到了很多风轻云淡地讨论在克隆技术的帮助下使尼安德特人或猛犸象复活的文章,但是撰写这些文章的人却往往不知道,我们已经获得的这两个物种的DNA序列是高度碎片化的,根本不可能涵盖整个基因组,而且由于在历史长河中因不断遭到破坏而分解脱落的结果,实质上我们从化石中获得的基因组序列比通常从一个鲜活的DNA中获得的序列要失准得多。
当然,解读尼安德特人的DNA无疑是一个令人惊奇的科学进步,它告诉了我们很多关于我们自身的演化故事,例如,它揭示了“现代人类的一些祖先与自己的“堂兄弟”尼安德特人之间的异血交配,使我们现代人身上留下了3%~4%的源于尼安德特人的基因组”这一事实。
为了合成我们所要求的生殖支原体基因组,我们需要一个极其准确的DNA序列。1995年,我们对最初的两个基因组的测序依靠的是早期的DNA测序仪,虽然我们当时达到的准确率已经突破了万分之一的错误率这个标准,但是我们还是担心,这个序列的质量也许不能保证产生可以用来创造出一个活的细胞的精度足够高的数据。因此,除了使用最新技术重新对生殖支原体的基因组进行测序之外,我们别无选择。我们的新的序列显示,最初的版本的精确度达到了每三万个碱基对中有一个错误,当我们把旧的序列和新的序列结合到一起之后,我们就拥有了更高的精确度——每10万个碱基对中的错误少于一个,而一个完全的基因组中的错误序列大约为6个。基于这种新的、高度精确的序列,我们开始设计合成生殖支原体基因组。
合成基因组的组装
我们已经拥有了把phiX174的数字代码转换成化学DNA的成功经验,这也使我们有充足的信心去创造一个能够独立生活的有机体的更大的基因组。自从我们能够高度精确地生成病毒基因组大小的基因片段后,我们就已经知道,如果我们能够把细菌染色体分解成病毒基因组大小的基因片段,并且找到一种可靠的方法将它们拼接在一起,那么我们就有机会获得成功。
为此,我们把目标基因组切割成了大小范围从5 000~7 000个碱基对的101段“卡带”。我们对这些基因“卡带”进行设计,使“卡带”与“卡带”之间相邻部分至少有80个碱基对是重叠的,而最长的重叠部分则限定为360个碱基对,这样我们就能够把它们像乐高积木一样连接起来了。我们这样设计基因片段的目的是为了让DNA序列能够在重叠区域实现互补:如果基因片段的最后一个字母是T,那么它就要与另一个基因片段的字母A绑定到一起。总之,这就像拉链一样,在重叠部分互补的碱基对紧密地结合在一起形成了螺旋状结构。
在努力创造合成基因组的过程中,我们需要考虑两个方面的因素。就像phiX174的基因组一样,生殖支原体的基因组是环状的,因此我们让第101段基因“卡带”与第一段基因“卡带”相互重叠一部分。作为基因组设计的一部分,我们也希望自己能够万无一失地把合成的生殖支原体基因组与原始的生殖支原体基因组区分出来。这一点是至关重要的,它能使我们不受人为假象的误导,从而保证我们始终都能跟踪合成的基因组,并且毫无疑义地证明,它驱动了一个新的合成细胞,而不是一个被污染的原始细胞或基因组。
就像艺术家通常会在他们的作品中签下名字一样,我们也想在新的基因组中留下签名,以便将它与原始基因组区别开来。因此,利用单一氨基酸代码的缩写,我们设计了一些“水印序列”(watermark sequences),它们能够拼出“J.克雷格·文特尔研究所”和“合成基因组学”以及投身到这个研究项目中的那些关键科学家的名字。我们使用不同的密码子来表示字母表中的20个字母中的某一个(不过,不是所有的字母都被表示出来,例如v与u是可以互换使用的)。以这种方式编码我的名字,其结果如下
TTAACTAGCTAATGTCGTGCAATTGGAGT
AGAGAACACAGAACGATTAACTAGCTAA
这些“水印序列”有间隔地插入到整个基因组中五段不同的“卡带”之中。我们还需要插入一个抗生素抗性基因,它能够让我们有选择性地杀死缺乏新的基因组的细胞,从而能够保证我们选择出合成基因组。作为基因组设计的一部分,我们将抗生素抗性基因植入到一个关键的生殖支原体基因MG408中,这个基因是细菌能够黏附于哺乳动物的细胞中所必需的。因为这个基因在生物体致病中起到了关键作用,我们有效地削弱了它,以确保不会危害到我们的合成生物体。
完成了上述工作之后,我们的研究团队就可以专注于最关键的一步了,即把这101个“卡带”组装成一个基因组。在我的坚持下,我们邀请了三家DNA合成公司来竞标组装这101个基因“卡带”这项工程的合同。但是,我们发现只有一家公司能合成5 000~7 000个碱基对的片段。此外,这也是一个非常昂贵的工作:DNA合成成本为每排列一个碱基对一美元,因此单单完成排列我们所提供的原始碱基对这个任务,就得花费超过50万美元。既然已经在财务上做出了如此严肃的承诺,我们更加决心要把这件事情做成功。
我们所面临的最大挑战是,如何将这101个“卡带”连接起来。想法来自我们早期的基因组测序项目。同时在此之前,由于我们试图涵盖尽可能多的生物多样性,我还发现,许多有机体在遭受大幅度的辐射损伤后,仍然能够重建自己的基因组。1999年,我们发表了一篇名为《抗放射性细菌耐辐射异常球菌R1的全基因组测序》(Complete Genome Sequencing of the Radio-re-sistant Bacterium, Deinococcus radiodurans R1)的论文,它描述的是一种能够在基因组的面上承受高达300万拉德电离辐射的新型微生物。而对人于类来说,只要暴露在500拉德相同的辐射之下就足以致命了,那么问题来了:这种异乎寻常的异常球菌在遭受如此强烈的辐射攻击之后,是如何存活下来的呢?我们能够利用相同的DNA修复机制造出一个合成基因组吗?
辐射对所有物种的蛋白质和DNA发挥作用的方式都是一样的,这部分与分子的大小有关。在我作为一名科学家的职业生涯早期,为了确定蛋白质的大小,我投入了大量的时间利用辐射去消灭活蛋白质。从原则上来讲,这种技术是很容易掌握的。辐射击破了蛋白质内部连接氨基酸的肽键,而且,对每个蛋白质只要进行“一次攻击”就足以破坏它的活性了。蛋白质分子的大小与击破肽键所需要的辐射量之间存在一种比例关系(较大的蛋白质分子比较小的蛋白质分子更容易被辐射击中),因此较小的蛋白质分子所需要的辐射剂量更多。我就是利用这种方法来确定神经递质受体蛋白质的大小和其复杂的功能的。
辐射以类似的方法影响DNA,它打破了连接碱基的化学键。与蛋白质一样,基因组越大,破坏基因组所需要的辐射剂量越小。由于我们人类的基因组较大,所以人类对辐射的影响比细菌敏感得多。一个人类细胞的基因组比一个微生物的基因组大了1 000多倍:一个人类细胞有60亿个碱基对,而一个细菌只有100万~800万个碱基对。因此,破坏我们人类的双链DNA所需要的辐射剂量远远少于破坏一个细胞染色体所需要的辐射剂量。正是由于这个原因,我们可以确信,如果我们非常不幸地遭遇了核战争,更小的生命形式的生存能力将会更强。
那么异常球菌是如何从辐射中存活下来的呢?当它被暴露于数百万拉德的辐射之下时,异常球菌的基因组遭到了破坏,数以百计的双链DNA断裂了,但是它能够修复并重组它的染色体,并且继续复制。它为什么会拥有这种能力,我们至今都无法完全理解,但是至少部分是因为,它的每个染色体都能进行多重复制,因此,当它遭受随机辐射引起的DNA内部的链断裂时,它的基因片段能够自行调整以产生用于DNA修复的模板。我经常把这个过程与我们在霰弹测序中所使用的一种方法相比,即在强大的计算机上运行的软件随机重组被测序的DNA片段的重叠部分,以重建基因组。
我们推断,如果我们能够在异常球菌细胞之外复制异常球菌的DNA修复和染色体组装过程,那么我们也许可以用这种方法用更大的、病毒大小的DNA片段来组装我们的合成染色体。我们团队中的两名科学家桑杰·瓦希(Sanjay Vashee)和张瑞园(Ray-Yuan Chuang)同意承担这项工作。他们的团队对异常球菌基因组中所有可能相关的基因进行了归类,然后花了两年的时间克隆了每个基因,以便它们在实验室中能够产生修复蛋白。为了进行DNA组合和修复,他们尝试了一系列基因组合。但是经过不懈努力后,我们被迫放弃了。因为我们已经走进了一条死胡同,我们需要一种全新的方法。
我们的下一个方法是开发一个符合逻辑的、逐步组合的计划。利用相邻“卡带”的DNA序列的重叠设计,我们在试管内将两个“卡带”组合了起来,从而形成了一个更大的片段。然后我们在大肠杆菌中克隆出了一个新的更大的片段,因此当这个微生物成倍地增大时,更大的基因片段被复制了出来。利用这种方式,我们就能够生产出下一阶段组装用的足够多的DNA了。我们的最终目标不仅是能够生产出生殖支原体基因组,而且我们还能在未来的几年内构建一个适合于创造任何种类的合成基因组的强大的、可进行再复制的组装过程。
在基因组组装的第一轮实验中,我们的计划是把4个“卡带”连接起来,其中每一个“卡带”大约为一个phiX174基因组的大小(这样我们将创造出一个拥有24 000个碱基对的基因组件)。这是通过利用一个DNA载体将四个等量的“卡带”添加进微量离心管(微型离心机)这种方式实现的,这样我们就能够在大肠杆菌内大量繁殖这种新构建的基因组片段了。我们所使用的DNA载体被称为细菌人工染色体(BAC),其中上述细菌人工染色体的一端与“卡带”1的起始部分相重叠,而细菌人工染色体的另一端则与“卡带”4的末端相重叠。
为了把这些基因片段接合起来,我们把一种酶(被称为3'-外切核酸酶)添加到了试管中的DNA混合物中,这种酶能够粉碎上述DNA的末端,并且只消化该DNA的两条链中的一条(这条链被称为3'链,这个名称是参照糖类中的DNA的核苷酸对碳原子的编号而定的),并离开暴露出来的另一条链(5'链)。利用温度变化控制外切核酸酶,我们可以确保“卡带”相应的单链末端能够找到彼此,并且黏合在一起,这要归功于每条链上的互补碱基对的化学吸引机制(因此我们还要感谢沃森和克里克)。
为了确保我们最终能够得到完整的双螺旋链,我们又加入了DNA聚合酶以及一些游离核苷酸,从而在任何情况下都不会使3'-外切核酸酶粉碎掉过多的链,因为聚合酶会把丢失的碱基填补回去。接着,我们把另一种酶——DNA连接酶加入到该混合物中以把这些重叠的链连接到一起。当所有的酶都完成了它们的工作后,我们就完成了全部四个“卡带”的连接工作,形成了一条拥有24 000个碱基对的链,或称“24kb”的链。为了产生能够组成一个完整的生殖支原体基因组的所有24kb“卡带”,我们将这一过程重复了25次。
由于我们已经在大肠杆菌中复制出了合成的DNA,因此我们拥有了足够的用来测序的DNA。在对所有25个24kb“卡带”进行了序列验证后,我们又在试管内重复了上述过程,这一次我们要把三个24kb“卡带”连接起来以形成一个拥有72 000个碱基对的“卡带”,每个“卡带”的大小大约相当于1/8个生殖支原体基因组。要做到这一点,我们首先必须用限制性内切酶把24kb“卡带”从细菌人工染色体载体中释放出来,这个细菌人工染色体载体是为了在大肠杆菌内培育它们而用的。
我们的细菌人工染色体载体是这样设计的:在我们插入的合成DNA的两侧都含有一个8个碱基的序列。这含有8个碱基的序列在生殖支原体基因组中并不是天然存在的,它是由一种称为“诺蒂”(NotI)的特定的限制性内切酶所识别出来的。当诺蒂切断细菌人工染色体的DNA时,24kb合成片段便被释放出来了。至此我们已经成功地合成了比以往所记录的任何合成基因组集都要大两倍多的基因。
我们要做的下一步便是再次重复这一过程,这一次是生产出一个拥有144 000个碱基对的片段,每一个片段都相当于1/4个目标基因组。我们准备通过相同的组装过程在试管内把两个72kb“卡带”连接起来。但是,从这个步骤开始,我们已经进入了一个未知的领域,我们的技术也已经发挥到了极致。当我们进行到倒数第二个步聚时,即当我们准备把两个1/4大小的基因片段结合起来,以制造出拥有290 000个碱基对的半个基因组时,我们遇到了麻烦:290kb片段太大了,以至于大肠杆菌根本容纳不了。
因此我们的团队开始寻找另一些能够稳定地适应这些巨大的合成DNA分子的基因片段。我们把目标瞄准了枯草芽孢杆菌(B.subtilis),一个日本的研究团队曾经用它培育出了一个巨大的细菌藻类基因组。但是,尽管枯草芽孢杆菌确实能够容纳巨大的290kb的基因片段,我们也有没有办法从这些细胞中原封不动地恢复DNA,因此我们还要另寻他法。解决方法来自一种更为复杂的真核生物,那也是世界各地的科学家在研究真核生物时非常喜爱使用的一种实验对象:啤酒酵母,又称酿酒酵母。几个世纪以来,啤酒酵母已被广泛用于酒精发酵以及制作面包,但是在科学研究中,它也是实验室里的“常客”,因为它具有相对较小的基因组以及一系列使基因的操作变得很容易的基因工具。例如,啤酒酵母已经被用于所谓的同源重组(homologous recombination)。在同源重组中,末端DNA序列相似的片段或者与啤酒酵母基因组中的序列完全相同的那些片段能够被拼接到它的基因组中取代间插序列。
酵母细胞大约比大肠杆菌大10倍,每个细胞被一层更厚的细胞壁保护着,这层细胞壁是细胞之间进行DNA传输的障碍。为了克服这个困难,酵母克隆(yeast cloning)需要用到一种被称为酵母裂解酶的酶来分解掉大部分细胞壁,以生成一种被称为去壁细菌细胞的东西。巨大的DNA片段可以更容易地导入这种去壁细菌细胞内部。酵母克隆可以产生稳定的环状人造染色体,并且由于它的环状性质,它还有另一个优点:更容易从正常的线性染色体中提纯出来。
我们发现,通过利用酵母克隆,我们能够培养出结构稳定的合成DNA;通过利用酵母的同源重组系统,我们能够把我们重叠的1/4基因组片段连接起来形成1/2的基因组片段。这个系统允许我们在酵母中组装完全的生殖支原体基因组。至此,通向合成第一个活的有机体的基因组这座山峰,经过漫长而艰难的攀登之路后,似乎终于已经走到了尽头,我们已经看到了希望的曙光。
我们在酵母细胞中插入了6个DNA片段:一个酵母克隆载体和5个相对应的生殖支原体基因组(4个1/4合成基因组片段以及一个为酵母克隆重叠准备的、被一分为二的合成基因组片段)。这个实验要想获得成功,酵母细胞就需要“接纳”所有这6个DNA片段,并且通过同源重组把它们连接到一起。我们筛选出了94个经过转化的DNA大小正确的酵母细胞,发现有17个细胞包含了一个完整的合成生殖支原体基因组。
重大突破:第一个合成支原体诞生
到此为止,尽管看起来我们在酵母细胞中组装合成细菌基因组确实成功了,但是我们还需要进行DNA测序来检查合成基因组的精确性,并确保组装过程没有引起任何错误。虽然这听起来很简单,但是我们必须研究出一些新的方法来从酵母细胞中重新获得我们的合成DNA,我们估计在细胞中只有5%的DNA具有代表性。为了丰富我们的合成DNA,我们利用酵母基因组序列知识以及合成基因组知识来选择只会把酵母DNA切成一个个小小的片段的限制性内切酶。然后我们利用凝胶电泳法把酵母DNA的残骸碎片从完整的合成染色体中分离出来。
最后,我们利用全基因组霰弹测序法对合成基因组进行了测序。结果表明,DNA序列与我们电脑设计的序列完全匹配,甚至连我们插入的水印也完全匹配,我们都非常高兴。是的,我们当然值得骄傲,因为我们已经合成了一个拥有582 970个碱基对的生殖支原体基因组,我们创造了拥有一个固定结构的最大的合成化学分子。我们终于实现了重大突破!
我们把第一个合成染色体生殖支原体叫作JCVI-1.0。我们把研究成果写成了论文,并于2007年10月15日投给了《科学》杂志,这一天刚好是我61岁生日的第二天。我们的论文在线发表于2008年1月24日,正式发表的时间则为2008年2月29日,我们为自己成功地创造了基因组而感到欢欣鼓舞,但是我们知道最大的挑战尚未到来:我们现在必须找到一种方法来把这第一个合成基因组移植到细胞中,以确定它是否能像一个正常的染色体那样发挥作用。在这个过程中,宿主细胞将被转换成这样一个细胞:它的所有组件都是按照我们的合成DNA中所保有的指令制造出来的。再一次,我们的成果是建立在许多早期研究成果的基础上的,而且与许多非常有才华的研究团队成员的天才想法分不开。事实上,这一切可以追溯到几十年前。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。