首页 百科知识 北极鳕鱼的构型是什么?北极鳕鱼的生存秘诀

北极鳕鱼的构型是什么?北极鳕鱼的生存秘诀

时间:2023-03-28 百科知识 版权反馈
【摘要】:蛋白质是细胞成分分子中的庞然大物,是生命的驱动者。蔗糖酶和其他蛋白质在振荡中形成的构型复杂多样,且各自都有着特定的功能。每种蛋白质的构型都高度复杂,与它们所执行的功能相适应。蛋白质的构型维持着生命世界的运转。作为应对,进化为生命带来了新的蛋白质构型,而具有新构型的蛋白质则可以承担新的工作。

  北极鳕鱼体型细长,体表呈褐色,腹部为银白色,鳍则是黑色,长约18~30厘米,是一种毫不起眼的海洋生物,但有一点除外:北极鳕鱼生存繁衍的区域位于海平面以下900米,纬度和北极相差不超过6度,那里的水域常年水温在0摄氏度以下。

在这样的温度下,大多数生物体内的液体会变成冰晶,边缘像锻造精良的利剑一样美丽,也像利剑一样致命,因为冰晶切割活体组织就像切黄油一样毫不费力。恒温动物体内具有温度调节系统,因此即使身处零度以下也能生存。但鱼类没有调节体温的能力,即便如此,北极鳕鱼在零度以下依旧能够生存。

北极鳕鱼能够生存的秘诀是体内合成的抗冻蛋白。抗冻蛋白降低了体液的冻结温度,很像汽车引擎冷却剂里的防冻剂。功能繁多的不同蛋白质是自然进化能力的典型例子。只要通过改变氨基酸序列以产生特定的蛋白质,地球海洋中的大片生命不能涉足的区域就可以变成适宜生存的乐园。

抗冻蛋白只是无数种进化奇迹之一,类似的奇迹在鱼类和所有其他生物的细胞中普遍存在。如果你能变小,在细胞里穿梭,你肯定会惊讶于细胞里居然有这么多不同种类的分子,数以百万计。有小些的,如水分子,有的稍大一点,譬如糖或者氨基酸,也有更大的大分子,如蛋白质。所有这些分子推推搡搡,你挤我我挤你,就像高峰时刻挤地铁上下班的乘客。

蛋白质是细胞成分分子中的庞然大物,是生命的驱动者。我们已经认识过代谢酶了,它们通过对相对较小的分子进行聚合、剪切或仅仅进行原子重排,合成细胞所需的所有物质,包括这些代谢酶自身的氨基酸。不过,并不是所有的蛋白质都是酶。有些蛋白质是细胞内的动力来源,例如驱动蛋白,驱动蛋白沿着细胞间纵横交错的刚性分子“电缆”移动,运输含有各种分子物质的小囊泡。一旦这些在细胞内“跑长途”的运输分子停止工作,混乱和无序就会接踵而至。举个例子,有一种驱动蛋白负责运输构建神经细胞之间连接的物料分子,倘若它的基因发生变异,会导致一种叫2A型腓骨肌萎缩症(Type 2A Charcot-Marie-Tooth disease)的绝症,表现为手脚无力并伴有感觉障碍。

还有一些蛋白质附着在DNA上,是基因的开关,这些调节性的蛋白质负责把基因编码的信息转化成氨基酸链。上百个类似的调节蛋白往往会同时展开工作,每个调节蛋白总是对某些基因产生作用,而对另一些则没有影响。(调节蛋白本身也是生物进化的动力之一,我们将在第5章讨论。)

蛋白质的功能还不止于此,细胞内还有组成细胞骨架的支柱蛋白质、输入养分的蛋白质、将废物排出细胞的蛋白质以及在细胞间传递分子信息的蛋白质等。

每种蛋白质对于生物表现型的塑造都有它独特的功能,而对于蛋白质来说,构型是它们最重要的特征。这里所说的构型不仅指蛋白质中20种氨基酸本身的分子形状,以及氨基酸之间相互的连接方式——这些统称为蛋白质的一级结构,还代表线性的氨基酸链经过空间折叠形成的立体结构。蛋白质的空间折叠我们在第1章中就已经略有涉及。

亲水性氨基酸倾向于靠近它们周围的水分子,而疏水性氨基酸——就像生物膜成分中的脂质,则倾向于逃避周围的水分子,氨基酸分子对水的不同亲和力使蛋白质的一级结构能够以特定的方式折叠。在热力学震动的驱动下,氨基酸链在折叠过程中会尽可能地尝试所有可能的构型,最后,大多数疏水性氨基酸会聚合在一起,形成紧密的核心。而最外层则被亲水性分子所覆盖,包裹内部的疏水性核心。

另外,有些氨基酸能够互相吸引,有些则会互相排斥,这些化学作用力也影响了蛋白质的折叠方式。蛋白质折叠过程仅由蹦蹦跳跳、行踪不定的分子决定,这再次提醒我们,自组织能力于生命而言有多么重要。我们体内有上万亿个细胞,只要细胞内形成一条新的蛋白链,它都要发生空间折叠。所以在一天中,蛋白质的折叠在每个细胞内都要上演几百万次。

如果从原子层面看,发生空间折叠的蛋白质看起来就像一团没有形状的泡沫,比如第2章中提到的能水解双糖的蔗糖酶。我们不妨退一步,把注意力集中在氨基酸链上(见图4-1),就可以辨认出些许有规律的氨基酸空间排列模式,这种模式在许多蛋白质中都存在,包括了一种螺旋形的结构和一种扁平的片状结构,片状排列也叫β-折叠。α-螺旋和β-折叠是蛋白质折叠的主要方式,两者即蛋白质的二级结构。多个α-螺旋和β-折叠,连同联结两者的非二级结构部分,构成了图4-1中所示的蛋白质的复杂三维结构,我们把这种三维结构称为蛋白质的三级结构。

图4-1 完成空间折叠后的蔗糖酶

虽然图4-1中的折叠看起来很像一团乱糟糟的意大利面,不过这种折叠方式实际上是高度有序的:任何一个蔗糖酶中的两条氨基酸链折叠的方式都是自发完成的,且折叠的产物完全一致。构型对于保证蛋白质的功能至关重要:热能导致折叠的蛋白质分子不断振动和振荡,而α-螺旋和β-折叠则起到引导并限制分子热运动的作用。振动受限让蔗糖酶这样的酶能够催化糖的裂解反应,原理有点像剪刀:如果没有连接刀片的转轴限制它们的运动,剪刀也就无法裁纸。鉴于热运动对酶分子的重要性,所以对每种酶分子的催化作用而言,都存在一个最适的理想温度:热量太低,分子振动微弱,不足以组织分子运动;热量太高,剧烈振动则会使空间折叠分崩离析,导致蛋白质变回线型氨基酸链。更糟的是,未折叠的蛋白质经常聚合成大团大团的惰性物质,就像熟鸡蛋里的蛋白。未折叠的成团蛋白质不仅无用,而且有害。就像如果你的大脑里积累了太多蛋白质块,就会引起严重疾病,例如阿尔茨海默氏症。

蔗糖酶和其他蛋白质在振荡中形成的构型复杂多样,且各自都有着特定的功能。每种蛋白质的构型都高度复杂,与它们所执行的功能相适应。用达尔文描述生命世界的话来说,这是一个“无尽之形最美”(endless forms most beautiful)的世界。蛋白质的构型维持着生命世界的运转。

蛋白质不仅需要处理眼下的工作和任务。如同人类的经济社会一样,生物也需要面对瞬息万变的挑战。作为应对,进化为生命带来了新的蛋白质构型,而具有新构型的蛋白质则可以承担新的工作。每当生命需要解决新问题时,比如在极度低温的环境中,体内生长的冰晶变成致命的刀片,威胁到自身的生存时,新的招募工作就开始了。

无论是早先的高炉,还是如今的智能手机,人类社会中的发明往往需要经历漫长的独立研发过程,并非一蹴而就。与之类似,自然界塑造生物新性状的过程也往往不是瞬间实现的。抗冻蛋白就是一个例子,不只是北极鳕鱼体内有抗冻蛋白,南极鱼类也有,但是两者的抗冻蛋白分别起源于不同祖先体内的两种蛋白质。抗冻蛋白甚至有过不止一次起源,不仅如此,有些鱼类还进化出了不止一种抗冻蛋白。美洲拟鲽是北大西洋的一种比目鱼,它的体内能够合成两种抗冻蛋白,一种防止血液结冰,另一种防止皮肤结冰。以进化的角度来衡量,有些蛋白质的出现着实非常迅速,只用了不到300万年的时间。

某些早期生物对冻伤非常敏感,它们体内的蛋白质与抗冻蛋白的氨基酸序列往往相去甚远,不过蛋白质进化所需的变化通常比我们想象的要少得多。只要改变一个氨基酸,合成组胺酸的酶就会变成功能不同的另一种酶,合成的产物也变成了色氨酸。大肠杆菌的一种酶能催化并从阿拉伯糖[16]中摄取能量,改变这种酶中的一个特定的氨基酸,它的功能就从转移酶变成了裂解酶。

可见,微小的变化同样能够对生命造成巨大影响,中亚的斑头雁也是一个例证。斑头雁是世界上飞得最高的鸟类之一。它必须飞得足够高,因为它的迁徙路线需要途经珠穆朗玛峰,那里的海拔超过8 000米。在这个高度上,周围的空气非常稀薄,鸟儿必须更加拼命地拍打翅膀,而且那里的氧气含量仅为海平面的1/3。攀登珠穆朗玛峰的登山者在到达这一海拔时往往需要借助氧气罐,而乘坐喷气式飞机的乘客则需要加压舱的保护。大雁无法借助这两者中的任何一项技术,但是没关系,它有更好的办法。斑头雁体内的血红蛋白在氨基酸序列上发生了变异,这种蛋白质负责将氧气从肺输送到肌肉。与我们体内的血红蛋白相比,斑头雁体内的血红蛋白和氧气结合更紧密。斑头雁能从稀薄的空气中摄入氧气分子,在别的鸟类不得不因为过高的海拔着陆时,斑头雁却能继续飞行。

北极鳕鱼体内的抗冻蛋白和斑头雁体内的氧合血红蛋白,都是弥足珍贵的进化产物。它们拓展了生物的活动范围,而更大的栖息地则意味着更多的食物、更高的生存概率以及更多的后代。还有一些进化的优势成果与这些改良的分子略有差异,比如区别一种食物与另一种食物的能力,比如晚餐选择有营养的而不是有毒植物的能力。这些性状优化的是生物的知觉,而不是它们的机动性。人类眼球后方的视网膜里含有三种视蛋白,这三种视蛋白在感光和适应不同波长的能力上高度特异化。多亏有它们,我们才能看见色彩斑斓的世界。但这一切并不是从生命出现之初就与生俱来的。

我们最古老的脊椎动物先祖可能只拥有一种视蛋白,它们眼里的世界是黑白的。大多数哺乳动物有两种不同的视蛋白:视红蛋白和视蓝蛋白,它们能看到的世界主要基于这两种不同的颜色。但我们和黑猩猩等近亲则能够看到基于三种原色的世界,也许这是因为色觉有助于我们的祖先觅食:在绿叶的衬托下,水果往往更加显眼。当然,不管什么原因,色觉进化所需的变化很少,少到只要改变三个氨基酸就能把视红蛋白变成视绿蛋白。

色觉进化等改变对我们往往是有益的,但也有一些进化对我们是有害的,例如某些细菌进化出的对医生开出的抗生素产生耐药性的能力。尽管我们不断地改进着抗生素,但是耐药性却始终不可避免,这是一场发生在细菌与生物技术专家之间的军备竞赛。这场竞赛让人想起刘易斯·卡罗尔(Lewis Carroll)在《爱丽丝镜中奇遇记》(Through the Looking-Glass, and What Alice Found There)中描写的红皇后,她曾对爱丽丝说过这样一句广为人知的话:“你瞧,在我们这儿得拼命地跑,才能保持在原地。”细菌在这场竞赛中找到了各种各样的新蛋白,有些蛋白质能够破坏抗生素分子,另一些则被称为“外排泵”,它们能把抗生素强行排出细胞,就像一支细菌救援小队把有毒气体排出被污染的房子。

基因转移加上频繁的人口流动可以在几个月之内把这些优良的性状带到世界的每个角落。还有一些蛋白质尤为阴险,它们负责排出的抗生素不止一种,如此一来,细菌就同时对多种抗生素产生了耐药性。说来奇怪,如果我们自己身体里的细胞失控,疯狂繁殖时也常常利用相似的外排泵对抗它们厌恶的抗癌药物。这不仅仅是癌细胞和细菌在面对危险时的英雄所见略同,同时它也是我们在对抗癌症的战斗中屡战屡败的原因。

生物进化中出现的外排泵并非无中生有,而是对已有运输蛋白进行修饰的产物。运输蛋白对维持细胞的日常运作与生存至关重要,因为它们不停地将成千上万的分子(养分、废物、建筑材料)送往细胞内的不同目的地。那么我们真的应该称之为新蛋白吗?同样的疑问也存在于斑头雁体内的改良血红蛋白和灵长类体内的感光细胞中。大自然不过只是胡乱摆弄了几下原有的血红蛋白,让它和氧气结合得更紧密;或者胡乱修改了一下视蛋白,调整了它的色觉灵敏谱而已,两者都算不上是严格意义上的“新”蛋白。

不过,如果你试想一下这些变化带来的影响:一只可以穿越任何山脉的鸟迎来了几百万平方公里的新栖息地;我们看到的世界是黑白的该有多无趣;耐药或者不耐药对细菌而言意味着生死之别。单就差异巨大的结果而言,这些小小的变化就足以被称为新性状。上述的例子无不说明,只要稍微改变几个原子就可以影响比原子大几百万倍的生物,并永远改变这个生物后代的命运。

我们在第3章里看到,通过基因水平转移重组代谢酶,大自然不断更新着生物体内的生化反应。即便如此,代谢酶自身也并不是这样形成的。从上述最后举的几个例子中我们可以看出,大自然会通过改变已有蛋白质的氨基酸序列创造新的蛋白质,我们已知的5 000多种酶中的每一种都是按照这种方式被创造出来的。此外,还有不胜枚举的蛋白质在我们体内负责调节基因、输送物质、收缩肌肉、运输氧气、输入养分、排泄废物、在细胞间传递信息以及承担其他无数种任务。蛋白质多样的功能足够我们写上整整一本书。事实上已经有这样的书了,这种专业的书对某些蛋白质的记述非常完备,事无巨细。

但这本书不属此类。

你无法只是通过道听途说就了解有一种蛋白质叫抗冻蛋白,还有一种叫视蛋白,以及理解这些蛋白质起源的真相,就像你没法只靠几个国家的卫星图像就画出一张完整的美国地图。要解释新蛋白质的起源需要我们拿它们与大量原始蛋白质进行比较,成百上千对地进行比较。

如果能解读基因的DNA或者基因编码的氨基酸链,也就是蛋白质的基因型,这个任务就会容易一些。对两者进行解读的先驱之一是英国生物化学家弗雷德里克·桑格(Frederick Sanger)。他是极少数得过两次诺贝尔奖的科学家之一,第一次是因为他成功破译了胰岛素的氨基酸序列,而第二次则是表彰他成功完成了对DNA的碱基测序。在距离他做出卓越贡献的几十年后,我们才终于掌握了解读代谢基因型的技术,才认识了更多蛋白质的基因型和表现型。这些基因型和表现型来自各种生物,所处环境各异:北极圈荒原、热带丛林、山麓、深海、人体内脏、滚烫的温泉、贫瘠的荒漠、肥沃的平原、肮脏的水沟和清澈的河渠。

这么大一堆关于蛋白质的事实如果不经组织,简直就是一本疯子编纂的字典,里面的几百万个单词杂乱无章,毫无头绪可言。然而一旦经过组织,这些事实就成了图书馆的一部分,这个图书馆和第3章中巨大的代谢图书馆类似。这个宇宙图书馆里收录的正是蛋白质的基因型,每个文本都由20个字母构成的字母表写就,每个字母对应一个氨基酸。这座图书馆收集了生命已经创造和能够创造的所有蛋白质,有时也被称为蛋白质空间(protein space)或序列空间(sequence space)——因为每个文本都对应一个唯一的氨基酸序列。

通过与前面章节类似的计算方式,我们大概已经可以预见,这个图书馆的规模和代谢图书馆一样惊人。回想一下,20种可能的氨基酸,两个字母可以构成的文本就有400(202)种。同理,3个氨基酸构成的可能文本有8 000(203)种,4个氨基酸对应于16万(204)种文本,以此类推。像这样的短文本充其量只能叫肽,大多数蛋白质包含的文本要长得多,即多肽,它的可能文本数量随着长度增加呈爆炸式增长,即便是仅由100个氨基酸构成的蛋白质,可能的文本数量也已经超过了10130种。这个数字大得难以想象,但是蛋白质图书馆内的馆藏数量比这还大,因为像蔗糖酶这样的蛋白质含有1 000多个氨基酸,而有些人类蛋白质比蔗糖酶还要再长许多倍。其中有一个庞然大物叫肌联蛋白(titin),含3万个氨基酸,是肌肉的弹性成分。由此可见,蛋白质图书馆的规模同样是超宇宙常数级别的。

蛋白质图书馆和代谢图书馆的相似之处不仅在于规模。和后者一样,蛋白质图书馆也是一个超几何体,相似的文本彼此邻近。每个蛋白质文本位于这个超立方体的一个顶点,就像在代谢图书馆里一样,每个蛋白质都有许多直接相邻的邻居,这些邻居和它只差一个字母,位于超立方体上相邻的顶点。

我们以一个含有100个氨基酸的蛋白质分子为例,如果你想改变蛋白质的第一个氨基酸,那么就有19个选项,这也就意味着与这个蛋白质只差第一个氨基酸的蛋白质邻居有19个。按照同样的思路,这个蛋白质有19个与其第2个氨基酸不同的邻居,19个与其第3个氨基酸不同的邻居,19个与第4个……19个与其第100个氨基酸不同的邻居。一句话,我们的蛋白质有1 900个直接邻居。这样一个社区已经很庞大了,但如果你改变的不是一个氨基酸,而是两个或更多,那么这个社区还会更大。显然,对进化来说这不是坏事:只要简单改变一个或几个氨基酸,就可以产生许多新的蛋白质。

在这座图书馆迷宫里漫游,要是手里没有一团展开的毛线丈量走过的路程,很容易就会迷路,这一点也和代谢图书馆类似。在这里我们也需要借助某种方式来衡量蛋白质图书馆里的“距离”,于是我们采用了两个蛋白质相异的氨基酸数目作为衡量距离的单位。这个标准可以告诉你,从一个蛋白质文本到任一其他文本要走多远,即需要改变多少个氨基酸。

图书馆中的文本很重要,但更重要的是每个文本承载的意义。我们的双眼无法解读这种意义,无法阅读蛋白质化学语言的单词、句子和段落,但生命自身精通这门语言,并能分辨出一个蛋白质文本到底是文风优美的佳作,还是词不达意的垃圾。

细胞判断蛋白质是否有意义的标准很实际:能让细胞存活的蛋白质就有意义。只有有用的蛋白质才有意义,有缺陷的变异蛋白不能正确完成折叠,自然也就一无是处。如果“意义”这个词听起来过于以人类为中心,我们不妨参考一下符号学——一门语言学的分支,主要研究意义的意义,其中对“意义”的定义是任何符号(随便什么东西,可以是路标,可以是一本书)所指涉的内容。根据这个定义,如果蛋白质的基因是符号,那么它所编码的蛋白质氨基酸序列以及蛋白质在细胞内所起的作用就是它的意义。

宇宙图书馆里到底确切地藏有多少本有意义的书,我们仍然无从得知。但经过几十年的研究,如今我们已经可以估算蛋白质图书馆里有意义的蛋白质的数量,因为大多数有用的蛋白质都有特定的折叠形状。从图书馆里随机选取一个书架,随机选取一个蛋白质,它能够折叠的概率至少是万分之一。这个概率听起来好像不是很大,但请记得,宇宙图书馆本身非常巨大,光是由100个氨基酸组成的蛋白质就超过10130个。即使其中只有万分之一的蛋白质能够折叠,也有10126个,即1后面跟着126个0,这比全宇宙中的氢原子数量还多。由此可知,有意义的蛋白质的数目大得超乎想象。

进化会利用大量的生物体对蛋白质图书馆进行探索。DNA一代接一代地复制,难免会出现复制错误,改变DNA链上的碱基,如腺嘌呤变成胞嘧啶,胸腺嘧啶变成鸟嘌呤,或者发生其他变化,每改变一个氨基酸,蛋白质就会发生改变。变化后的文本可能具有全新的用途,想要理解这一过程,我们就得绘制蛋白质图书馆的地图,就像在代谢图书馆中做过的那样。这个任务没有看上去那么难:多亏研究蛋白质的科学家们在过去数十年中的不懈努力,我们已经知道了成千上万种蛋白质的折叠方式、功能以及在图书馆中的位置。另外,借助20世纪的分子生物学技术,我们可以从书架上取下任意一卷书,合成相应的蛋白质,并在实验室里研究它的折叠方式和功能。

有关蛋白质进化中的一个最简单的问题,我们在之前的章节中已经探讨过了。要找到一个有一丁点意义、有助于生物体存活的蛋白质有多难呢?如果图书馆里只有一个这样的蛋白质,即便从遥远的大爆炸开始找也很难找到。既然存在大量有意义的蛋白质,那么生命在面对不同的挑战时,就会有多种解决方式,但到底有多少种呢?

2001年,哈佛大学的安东尼·基夫(Anthony Keefe)和杰克·绍斯塔克(Jack Szostak)试图回答这个问题,他们研究的蛋白质家族的重要性不亚于生命历史中出现的任何其他性状:这类蛋白质可以联结三磷酸腺苷,而我们已经在第2章中说过,三磷酸腺苷是生命的电池。一般情况下,蛋白质通过裂解三磷酸腺苷摄取工作时所需的能量,包括运输材料、收缩肌肉、构建新分子等。

想要释放和利用三磷酸腺苷的能量,蛋白质首先要结合三磷酸腺苷。如果庞大的蛋白质图书馆里只有一种蛋白质能够结合三磷酸腺苷,盲目寻找不过是在白费力气,想找到它除非有奇迹出现。基夫和绍斯塔克想弄清楚,图书馆里能够结合三磷酸腺苷的蛋白质究竟有多稀有。他们采用化学手段创造出许多不同种类的蛋白质,每种蛋白的氨基酸序列都不相同,完全随机。这个人工设计的过程相当于从蛋白质图书馆书架上随机取下一册书卷。研究者制造的随机蛋白质均含有80个氨基酸,这样的蛋白质数量超过10104种,不可能全部在实验中合成出来,但这个实验中所合成的随机蛋白质数量已经相当惊人了:大约有6万亿种。

基夫和绍斯塔克发现,其中4种毫无关联的蛋白质可以结合三磷酸腺苷。6万亿种蛋白质中有4种可以结合三磷酸腺苷的蛋白质,是不是听上去一点都不富裕?但是按照这一比例,所有包含80个氨基酸的候选蛋白质中能结合三磷酸腺苷的就多了去了:1093个。三磷酸腺苷结合问题的答案是一个天文数字。

麻省理工大学的约翰·里德哈尔-奥尔森(John Reidhaar-Olson)和罗伯特·索尔(Robert Sauer)研究了同样的问题,但采用的方式不同。他们研究的是一种调节蛋白,这种蛋白可以关闭病毒的基因,后者能感染细菌。这种病毒名为A字形噬菌体,它的DNA所编码的蛋白质使它能自我复制并杀死宿主。但利用开关关掉基因后,这种病毒也可以在细菌体内休眠,直到时机成熟再自我复制并杀死宿主。通常当宿主遭遇不幸时,如饥饿、抗生素污染、过量的紫外线照射,就意味着时机到了,病毒于是趁机开始复制,复制所得的子代病毒冲破细胞,将满目疮痍的细菌遗弃。那场面用一句不恰当的俗话说,大概就是“树倒猢狲散”。

奥尔森和索尔探索了蛋白质图书馆中这个病毒开关附近的一个社区,随机创造出大量社区中的氨基酸序列,从而探究哪种序列可以产生有效的开关关闭病毒基因。他们计算的结果是,整个图书馆中有超过1050个文本能够编码关闭基因的分子开关。他们把类似的算法应用于另一种蛋白质,即合成氨基酸所需的酶,发现了多达1096种蛋白质可以完成这项工作。

自然界中的抗冻蛋白给了我们一个提示,之后我们在实验室中则以实验证实了这个猜测:无论是结合三磷酸腺苷,关闭病毒基因,还是催化生化反应的蛋白质,都不是唯一的,应对相同问题的解决方案甚至可能超过100万种。具有不同功能的蛋白质数目是一个天文数字,每一种都对应蛋白质图书馆中的一卷书。图书馆中馆藏数量之多,难以想象。就生物的创造力而言,只有我们想不到,没有自然界做不到。

事实上,解决特定问题的书在图书馆里取之不尽。当然,知道这一点还不够。我们还要找出这些答案的位置和组织方式,它们是整整齐齐地排在书架上呢,还是随意摞成一堆?仅有实验室的实验是远远不够的,因为即使实验能够合成并测试惊人数量的蛋白质,但与自然界中实际的蛋白质数量相比,依旧显得无足轻重。在自然界中,每一天都有不计其数的生物体在加班加点合成新的蛋白质,每个生物体都是合成蛋白质的量产工厂,而每一个蛋白质都不过是在持续了亿万年的蛋白进化之路上,最后的那一个脚步而已。

蛋白科学家早就已经注意到了蛋白质的多样性。如果把蛋白质比作糖,拥有数量庞大的蛋白质的自然界就像一家巨大的糖果店,心怀热忱的科学家就像孩子一样一拥而上。比起实验室中得来的数据,科学家在成千上万的生物体中得到的有关蛋白质进化的知识要多得多。我们前面探讨过的斑头雁体内负责输送氧气的血红蛋白就是一个很好的例子。

血红蛋白的功能不难理解,它往返肺与身体组织之间,完成对氧气的结合或释放,它的重要性也无须赘述。血红蛋白属于一个结合氧气的蛋白质家族,即球蛋白(globins)。球蛋白不仅对我们,对于许多其他的哺乳动物、鸟类、爬行类和鱼类也同样重要。这些物种最初具有共同的祖先,但随后经过无数代遗传,如父辈、子辈、孙辈和数不清的曾孙辈,在一代代演替过程中,编码血红蛋白和所有其他蛋白质的DNA经历了无数次复制。虽然每次复制都极少出现复制错误,对我们的细胞而言,DNA复制过程中大约平均每4 000万个碱基中才会出现一个复制错误,但只要假以时日,只要时间足够长,理论上一个基因组中的所有基因都会出现复制错误,从而导致它们编码的蛋白质产生变化。

编码氨基酸序列的基因变化后,球蛋白不再按照正确的方式折叠,氧气也就不能流向需要的地方。简单地说,这通常意味着死亡。但发生改变的蛋白质不一定会完全丧失原本的功能和意义。甚至有些改变既不会改变蛋白质的功能,也不损害基因存在的意义,并能够传给下一代。经历无数代繁衍,复制错误,尤其是某些可容忍的复制错误在基因组中逐渐积累,就会慢慢改变蛋白质的氨基酸序列。

图4-2展示的是人类以及3种物种分类上的亲缘生物,各自血红蛋白中的10个氨基酸片段。图中的每个字母都取自包含20个字母的字母表。科学家通常用字母缩写代表氨基酸:V代表缬氨酸,A代表丙氨酸,诸如此类。大约500万年前,即差不多20万代人之前,我们和与我们血缘关系最近的黑猩猩还拥有一个共同的祖先。由于这段时间还不足以积累大量的遗传错误,因此黑猩猩的球蛋白文本迄今没有改变太多。在图4-2中展示的球蛋白片段里,人类和黑猩猩只有一处不同:在人类血红蛋白为丙氨酸(A)的位置上,黑猩猩的则为谷氨酸(E)。

图4-2 蛋白随时间变化图

大约800万年前,人类的祖先和老鼠的祖先分道扬镳。因此比起黑猩猩,老鼠的球蛋白累积变化的时间更长。图4-2显示,人类和老鼠有两处氨基酸差异。鸡的祖先和我们的祖先分开得更早,是在近3亿年前,所以其间累计的氨基酸差异则相应达到了6个。

还有几百万种生物体含有血红蛋白,除了恒温的脊椎动物,还有爬行类、青蛙、鱼类、海星、软体动物、苍蝇、蠕虫,甚至植物。其中一些物种从生命之树的同一枝条上生长出来,距离它们拥有同一个祖先的日子还不太远。它们的球蛋白基因在生物史上的大部分时间里都是相同的,只是在最近才分道扬镳,但是依旧十分相似。另一些生物体位于生命之树的不同树枝上,距离它们拥有共同祖先的日子较久远,控制球蛋白合成的基因相差也更大。但不管这种差异有多大,它们编码的球蛋白都能正常工作,否则这些球蛋白基因就不会存留至今。每个幸存的基因解决氧气结合问题的方案都不尽相同。生命每延续1 000年,就会进入蛋白质图书馆的更深处,在随机进化之旅中探索全新的球蛋白文本。

想知道球蛋白在进化之旅中走了多远,需要想想我们最远的亲戚:植物。尽管植物没有血液,但事实上还是有一些植物能够合成球蛋白。

大豆、豌豆、苜蓿等豆科植物可以从空气中吸收至关重要的氮元素,而空气中的氮几乎是取之不尽的。(其他植物大多需要从土壤中吸收氮,除非农民施用化肥,否则土壤的氮含量通常很低。)豆科植物借助细菌从空气中吸收氮,这种细菌成群结队生活在植物根部附近,体内含有一种特殊的酶,能将空气中的氮气转化为铵盐,铵盐也是含氮化肥的主要成分。这种天才的共生关系只有一个缺点:大气中的氧气会破坏固定氮气的酶。植物为保护这种酶而合成球蛋白,根部的共生细菌因而得以远离氧气。

植物和动物的共同祖先可以追溯到10亿多年前,动植物处于生命之树不同的主枝上,两者间的球蛋白的差异大得惊人,这表明动物和植物相互独立的进化旅程已进行了很久。举个例子,羽扇豆和昆虫的球蛋白中几乎有90%的氨基酸都不同。然而,如图4-3所示,这些球蛋白不仅都能结合氧气,折叠形状也十分相似。左图是一种豆科植物的球蛋白折叠,右图是一种小型双翅昆虫摇蚊的球蛋白折叠。两种蛋白质都有几处螺旋体一样的结构,例如左上方和右下方有两处排列十分相似的平行螺旋。图像无法完全说明这两个球蛋白有多相似,如果你转动分子,把其中一个覆盖到另一个分子之上,就会发现两个分子中原子的空间分布几乎一模一样。尽管已经各自独立进化了10亿多年,但这些球蛋白的折叠方式依然十分相似。

图4-3 两种折叠方式相似的血红蛋白

豆科植物与昆虫球蛋白的氨基酸差异极大,但这种差异稀松平常。哪怕对于两种动物球蛋白而言,很可能有80%的氨基酸也是不同的,比如蛤和鲸。尽管有种种差异,上述以及其他生物体体内的上千种球蛋白仍然彼此相关联,组成一张网络,遍布蛋白质图书馆。这张网络上的通路连续不断,从共同祖先出发,每走一步改变一个氨基酸,但文本含义保持不变。

类似的基因型网络我们已经在代谢图书馆中探讨过了,无论生物进化在这张网络中往哪个方向走,走多远,代谢表现型的意义总是保持不变。进化在探索蛋白质图书馆的过程中采用了一种不同的策略,不是基因水平转移,而是改变单个氨基酸,但两者的本质是相同的。基因型网络将不同的球蛋白连接在一起,网络的根须触手一直延伸至蛋白质图书馆的深处。进化可以沿着这个网络探索图书馆,不致迷路而陷进由无用分子围成的致命流沙中。

球蛋白形成的基因型网络规模庞大、交错纵深并不是例外,而是普遍规律。折叠方式、催化反应以及祖先相同的酶,它们的氨基酸的相似度通常不超过20%。我们能认识到这一点,是因为科学家已经在图书馆里确定了上千种已知酶的编码文本位置。通过给文本编目,我们能够绘出酶的基因型网络在图书馆中的通路,其中有一些甚至比球蛋白延伸得更远。延伸最远的是TIM桶状蛋白质,TIM是磷酸丙糖异构酶(triose phosphate isomerase)的首字母缩写。由于α-螺旋和β-折叠的排列方式像木桶夹板,所以这种酶被称作桶状蛋白。TIM有助于从葡萄糖中摄取能量。令人震惊的是,有些以相同方式进行折叠的酶与TIM没有一个氨基酸相同。它们分别位于蛋白质图书馆的对角位置,即所有字母都互不相同,尽管如此,它们却携带着相同的化学信息。这些蛋白质就像无数个不同版本的《哈姆雷特》,尽管不同版本的4 000行台词中只有几百行相同,甚至没有一行相同,但每个版本都完整地讲述了莎翁笔下那个王子复仇的故事。

自然实验室中的上千种蛋白质同样叙述了一个类似的故事:不管是酶、调节因子还是像血红蛋白那样的运输分子,当我们需要一个新的蛋白质解决眼前的问题时,解决方案往往多得数不过来。不仅如此,应对相同问题的蛋白质由一张众多蛋白质文本构成的巨网相连,遍布蛋白质图书馆。在某些蛋白质网络中我们已经能够认出数千种蛋白质了,可是这也只是沧海一粟,要知道,一张网络中具有相同表现型的蛋白质往往多达数万亿个。

有些未知的蛋白质属于早已灭绝的生物,但是绝大多数蛋白质甚至从未在自然界出现过。生命历经的40亿年太短,只够创造出1050种蛋白质,这只占蛋白质图书馆所有文本中的极小一部分。不论巨大的生命之树上挂着多少蛋白质,也不论这棵树有多么高大、多么美丽,它终究只是脏兮兮的镜子里污迹斑斑的影像,是柏拉图的理想世界中模糊不清的幻影,唯有背后那张更大的基因型网络才是这一切的本质。

我们在第3章里看到,在进化过程中,有几十亿读者通过基因型网络探索着代谢图书馆各个角落里的不同社区。尽管有些探索者掉下网络一命呜呼,但也有一些探索者通过网络发现了新表现型的进化文本。基因型网络或许同样可以服务于蛋白质,前提是蛋白质图书馆里的社区也具有多样性。否则,进化的蛋白质还不如待在原地不动。因为如果图书馆不同区域堆放的书籍相同,也就没有探索图书馆的必要了。

图书馆中每个蛋白质附近书架上的文本是否意义相近,是否就像现代社区中大同小异的家家户户?还是更像中世纪的村庄,风格独特,魅力各异,所含蛋白质拥有独一无二的新功能?尽管我们研究了几十年蛋白质,如今甚至可以用计算机挖掘堆积如山的蛋白质数据,但是对于这个问题,直到现在我们也没有找到答案。

要回答这个问题,光有计算机还不够,还需要热爱书本的图书管理员。一个年轻的智利研究者埃万德罗·费拉达(Evandro Ferrada)带着这份热爱来到苏黎世,加入了我们的研究小组攻读他的博士学位。埃万德罗曾经有过研究蛋白质的经验,他能熟练地从巨大的蛋白质数据库中筛选出所需的信息,不论是蛋白质的折叠方式还是蛋白质分子内的原子信息。埃万德罗个性安静,常常陷入沉思,这种个性我以前在别人身上见过,这些人常常与生命的深层奥秘缠斗。也许这也是他同意研究这个问题的原因,因为蛋白质的空间结构正是这样的奥秘:挑战性强,意义深远,异常艰难,但也不是没有被解决的可能。另外,蛋白质的空间结构里还隐藏着蛋白质进化的秘密。

埃万德罗重点研究的是酶,因为这类蛋白质的种类异常丰富。这毫不意外,因为酶需要催化5 000多种不同的化学反应。科学家已经对酶进行过深入研究:他们已经把蛋白质图书馆中散落的几千种蛋白质标记了出来。一旦我们知道了酶的精确位置,就可以用计算机进行分析。埃万德罗利用电脑选出一对蛋白质,它们的折叠方式相同,但在基因型网络中处于不同位置。紧接着,他检验了第一个蛋白质所在社区的一小部分相邻蛋白,列出了其中所有已知的蛋白质和它们的功能。之后,他以相同的方式检验了第二个蛋白质所在的社区,列出了经过检验的所有已知蛋白质和它们的功能。他比较了两张列表,关注点集中在两个列表中的蛋白质是否相同,以及两个社区的蛋白质功能是否相同。然后他选取了另一对蛋白质,重复相同的检验过程,关注相同的问题,直到他研究了几百对蛋白质和它们所在的社区。

最终的答案很简单:即使两个蛋白质在图书馆里离得很近,它们的社区内包含的大部分蛋白质功能也不同。比如,某两个蛋白质中存在差异的氨基酸只有不到20%,即便如此,它们各自所在社区里的蛋白质的大部分功能也都不同。蛋白质图书馆和代谢图书馆一样,社区高度多样化。出于同样的原因,这种多样性使得庞大的基因型网络与探索蛋白质图书馆的过程相适应,蛋白分子在保存原有意义的同时,拥有进化成为功能不同的新蛋白质的巨大潜力。

代谢图书馆和蛋白质图书馆中充斥着基因型网络,这些网络由含义相同的文本构成,每个文本都被放置在高维空间的超几何体上,两个图书馆里的多样性社区数量也都多得难以想象。它们彼此间有诸多相似之处,但都与人类图书馆大相径庭。不过这也没什么好奇怪的,因为远在人类出现之前,它们就已经存在了。

确切一点说,代谢图书馆和蛋白质图书馆的出现至少比人类早了30亿年。从那时候起,蛋白质就从RNA手里接管了大部分生命的工作。这样做绝对有着充分的理由,因为蛋白质的构件要多得多,RNA只有4种核苷酸,相比之下蛋白质则有20个不同的氨基酸,大自然可以用蛋白质书写更多不同的文本。要写一条10个字母长的链,用4个字母的字母表大约可以写出100万条,而用20个字母的字母表则可以写出超过10万亿条,后者是前者的1 000万倍。相比RNA,蛋白质文本的数量要多得多,而且文本越长,两者的差异越明显。更多的文本意味着更多的构型,参与更多的反应催化,执行更多的功能和完成更多的任务。

但RNA的出现确实先于蛋白质,就凭这一点,RNA就足以在生物进化的万神殿里享有一席之地。如果没有历史上的第一个自我复制分子以及它的进化,也就没有今天的我们。不理解这种进化的过程,我们的工作也就不能算是完整的。

幸好,RNA和蛋白质之间有许多相似之处,这有助于我们理解RNA的进化。我们可以把RNA文本组织成一座超立方体图书馆,虽然不如蛋白质图书馆大,但依然规模惊人。在图书馆中,相似的文本离得近,相异的文本离得远。这座图书馆也属于高纬建筑,这意味着其中的社区比三维空间里的大得多,即一个文本附近有许多其他文本。由于RNA长链分子和蛋白质一样高度灵活,所以许多RNA文本的意义也会借助构型语言来表达。和蛋白质一样,RNA链也会在空间中弯曲扭转,精心折叠。

不幸的是,RNA与蛋白质的相似之处仅到此为止。RNA分子似乎不愿意轻易显山露水,对它的构型研究一直不顺利。科学家们至今只确认了数百个RNA构型,而我们已经知道了上千种蛋白质的构型和功能,相比之下,已知的RNA构型数量简直微不足道。我们在蛋白质中取得的成果,即大量比较自然界中的蛋白分子并绘出图书馆模型,暂时还不可能在RNA分子上重复。

尽管如此,得益于奥地利科学家彼得·舒斯特(Peter Schuster)和他的同事们的工作,RNA图书馆的建设并不是毫无进展。舒斯特是欧洲计算生物学的鼻祖之一,他从20世纪70年代起就在维也纳大学担任教职,现在是该大学的退休教授。我与舒斯特的第一次会面似乎印证了许多欧洲人对奥地利人的固有印象。舒斯特个性活泼,块头很大,幽默感奇特,哪怕出现在奥匈帝国晚期的传统维也纳咖啡馆也毫不突兀,因为那样的地方往往聚集了大量受过良好教育的饱学之士,从心理分析到量子理论,他们对每件事都能滔滔不绝。舒斯特正是那种传统的科学家,一个纯粹的知识分子,对各种话题都能信手拈来。他不摆架子,说话风趣,就算谈话内容再严肃也会找机会岔开话题幽默一把。有句耳熟能详的谚语阐释了奥地利人对生活本身和生活中诸多挑战的看法:“情况不容乐观,但是绝望为时尚早。”舒斯特本人就是这句谚语的写照。

舒斯特看起来大大咧咧,但思维开阔、头脑清晰。他是提出RNA世界起源理论的先驱之一,他的研究小组开发的计算机程序成功预测了RNA一个重要的分子特性,即它具有二级结构。

当RNA单链进行折叠时,首先出现的正是它的二级结构。随着RNA链扭转、弯曲、缠卷,部分核苷酸互相配对,在分子内形成局部的双螺旋区段,像极了著名的DNA双螺旋。众多双螺旋与它们之间的单链区域,就构成了RNA的二级结构,而所有这些结构都是由一条RNA长链通过自身折叠形成的。RNA的二级结构就像蛋白质的α-螺旋和β-折叠,二级螺旋结构通过自组织形式,向更高级的立体结构自发发展。

舒斯特能通过核苷酸序列计算出RNA的二级结构,不仅如此,他们小组的计算机程序运行得飞快,几秒内就能预测出几百种分子构型。而对于更加复杂的RNA三维结构,我们至今都无法做到快速运算。有了如此高效的程序,我们就可以开始绘制RNA图书馆的地图了。即使我们离完全理解RNA的折叠方式和功能还有很长一段路要走,二级结构本身已经足够关键了:如果一个RNA分子的核苷酸顺序发生变异,破坏了它的二级结构,这个分子就不能进行正确的三维折叠。二级结构对RNA分子的意义至关重要,正如花束不能跳过一朵花凭空出现,RNA分子的三级结构也无法逾越二级结构存在。这个理由充分论证了研究二级结构的必要性。

舒斯特身边的研究人员在RNA图书馆中发现了许多可以解读的分子含义,令人眼花缭乱,而所有分子含义都可以通过RNA构型进行表达。举例来说,对于一个含有100个核苷酸的RNA,它的不同构型的可能数量已经达到了1023种。许多天然RNA分子包含的核苷酸更多,更长的RNA链则相应拥有更多的可能构型。

另外,构型相同的文本在RNA图书馆中的组织方式和蛋白质图书馆非常相似,即文本连成网络,延伸至图书馆深处,你可以通过微小的改变积累,逐步修改,直到彻底改变一个文本的内容,同时保持文本编码的RNA功能不变。像蛋白质图书馆一样,RNA图书馆中不同的社区更像中世纪的村庄那样多姿多彩,而不像城里的社区那样大同小异。每个社区里的构型都不尽相同,任意两个不同的社区之间的交集也廖廖无几。这一切都意味着RNA进化所遵循的规则与蛋白质相同,而最新的实验表明事实的确如此。

2000年,麻省理工大学的埃里克·舒尔特斯(Erik Schultes)和戴维·巴特尔(David Bartel)完成了一个巧妙的实验,在RNA图书馆中开辟了一条新的道路。实验开始于两个较短的RNA文本,每个文本含有的核苷酸不超过100个。两个文本的许多核苷酸都不同,在图书馆中的位置相去甚远。不过它们并不是随随便便的RNA分子,两者都是核糖酶(ribozymes),是由RNA而不是蛋白质组成的生物催化剂。两个核糖酶扭曲形成不同的三维构型,负责催化不同的反应。第一个分子可以将一条RNA链分解成两条,第二个正好相反,主要通过原子键融合两条RNA链的末端,把两条链联结起来。我们姑且把这两种酶分别称作“切割酶”和“连接酶”。

如果你手头有一个切割酶分子,需要在图书馆某处找到一个连接酶,会是轻而易举还是难于登天?或者相反,通过手头的连接酶寻找切割酶呢?换句话说,以任意一个分子为起点,你能否通过对图书馆进行探索找到另一个想要的分子,就像分子进化能够实现的那样?如果你对基因型网络一无所知,就会认为这不可能,因为这两个分子天差地别。即便可能,大概也非常困难,因为一招不慎则满盘皆输,任何一点失误导致的缺陷分子在进化中几乎都意味着死亡。

舒尔特斯和巴特尔没有被困难吓倒。他们模仿自然选择的过程,从其中一个分子出发,一步一步改变核苷酸的序列,同时要求每一步都保留原本的分子功能,尝试向另一个分子靠近。他们利用自己掌握的化学知识预测穿过图书馆的可行路径,合成所有候选的变异RNA,测试新链能否像它的前辈一样催化相同的反应。如果不能,他们就尝试另一条不同的路径。

读到这里,你可能不会再对他们的发现感到惊讶了。从连接酶出发,他们一点一点地朝着切割酶靠拢,在这个过程中他们一共修改了40个核苷酸,同时保证新获得的RNA分子具有融合两条RNA链的能力;从切割酶出发,他们也以同样的方式,向着连接酶一点一点地修改核苷酸,在修改了40个核苷酸后,仍然保持新获得的RNA分子具有裂解RNA的能力。在两种分子相互转变的中间点附近,奇妙的事情发生了:只要对不到3个核苷酸分子进行修改,核酸酶的功能就会发生颠覆性的改变。连接酶变成了切割酶,而切割酶则变成了连接酶。

这个实验像许多优秀的实验一样,传达了不止一条重要信息。第一条,具有切割酶和连接酶含义的文本不止一个,而是有很多。第二条,这些分子在RNA图书馆中相互连接,即便必须以保留分子功能为前提,你也可以循着这张网络找到功能相同的新分子。正是基因型网络使得这一切成为可能。第三条,循着网络中的某条道路前进,你总会在某个文本所在的社区中找到你想要的新性状。

在真实的进化历程中,探索RNA图书馆需要大量分子充当读者,而上述实验中只有一名孤单的读者。此外,科学家还要凭借生化知识指导这个读者,以防止它乱走,根据实验设计,它一直在沿着基因型网络前进。这使我心头一直萦绕着一个疑问:大自然中的RNA在进化上其实是随机而盲目的,对于现实中的进化而言,基因型网络是否对它也有助益?这个问题的答案直到10年之后,在我位于苏黎世的实验室完成一项与进化有关的实验后,才渐渐浮出水面。

大多数人认为进化非常缓慢,所需的时间与我们每个人的正常寿命根本不在一个数量级上。就人类的进化而言,这的确是事实,1 000年的时间才相当于50代人,但许多其他生物的世代时间就要短得多,比如大肠杆菌,它每20分钟就能繁衍出下一代。繁殖50代大肠杆菌甚至用不了一天。一个RNA分子几秒钟就能完成自我复制,RNA使用的分子复制体系与复制DNA的那一套相仿。不消一天,你就能得到上千代RNA。

有了快速复制的生物体和分子,实验室就可以开展一个雄心勃勃的实验:重演进化。类似的模拟进化实验能够让科学家形象地看到进化如何在生物传宗接代的过程中,逐渐改变整个生物种群。由于RNA分子对早期生命至关重要,它们在这种实验中就显得特别有吸引力。RNA分子兼具自我复制和变异的遗传特性,本身的性状又能够作为自然选择的作用对象,集各种进化的要素于一身。

2008年秋,我为开展实验室里的进化实验面试了一些新人,希望能解决萦绕我心头多年的疑问。其中一个年轻的美国科学家非常出挑,不仅因为他的证书,也因为面试时他穿着徒步鞋。虽说大多数学院的科学家都崇尚休闲打扮,对其他职业严格的着装要求往往嗤之以鼻,但徒步鞋还是有点不同寻常。起码,这显示出了他的健康自信。

这个年轻人叫埃里克·海登(Eric Hayden),是一名化学家,刚从俄勒冈州立大学取得博士学位,他在RNA酶方面进行的工作非常杰出。虽然之前对进化生物学所知甚少,但他对进化表现出了深深的好奇。他面容坦率,一个微笑就照亮了房间,顿时让人心生好感。我和他简短地谈了谈,随后就让他和组里的其他研究员随便聊聊,看看他在我们的圈子里是否自在。他肯定觉得就像在家里一样舒坦:一个小时后回到我办公室时,他已经脱下靴子只剩袜子了,他解释说靴子太热了。

埃里克得到了这份工作,而我从未后悔这个决定。他非常了解RNA,做实验谨慎仔细,非常讨人喜欢。我觉得能和他一起工作是我的荣幸。

埃里克在我的研究小组里负责研究一种核糖酶,这是一种RNA酶,用以帮助某些细菌表达基因。这种酶可以根据特定的核酸序列辨识相应的RNA链,然后对目标RNA进行切割,随后将自身连接到其中一个片段上。(许多生物细胞内都有能识别并裂解特定DNA和RNA的分子,它们的目的多种多样,例如破坏入侵病毒的外来DNA,或者把较短的DNA片段连接成相对较长的DNA。)关于这种酶,我只想知道基因型网络能否改变这种酶,使它能够识别新的RNA分子。

为了找出答案,埃里克把这种酶复制了10亿多份——所有复制所得的酶正好相当于一汤匙,然后用分子复制体系对这10亿个酶进行扩增。生物本身的复制体系并不完美,偶尔会出现复制错误,因此获得的少量核糖酶会出现变异。随后,埃里克运用某种化学方法,设法让变异体中那些依旧能够识别原目标RNA的核酸酶继续复制。这种手段巧妙地模拟了自然选择的核心要求:只有保留原先功能的变异分子才能在生物的代际之间传递。

埃里克的实验循环了许多次。第一次循环前,所有的分子都一模一样,就像10亿个读者在图书馆里弯腰读同一卷书。第一代分子诞生后,许多分子已经变异了,其中只有一部分能活下来。幸存的分子在衍生出第二代分子时进一步发生变异,循环往复。仅仅过了10代,子代与初始RNA的平均核苷酸差异就已经达到了5个,有些甚至相差多达10个。这10亿个读者已经在图书馆里一哄而散了。

只需要上述简单的观察,我们就可以得出埃里克实验的第一个结论:经过数代复制,这群RNA分子已经不是完全相同的了,它们与初始RNA分子之间多少存在数个核苷酸的差异。尽管基因型已经改变,选择机制却使得所有分子保留了相同的功能特征。由于不同的RNA分子分布于图书馆的不同位置,埃里克的实验已经表明,基因型网络在RNA图书馆中同样存在。

实验的第二个结论涉及两类分子。第一类分子是我们在上面所说的“混合”分子,而第二类分子则是初始RNA分子,其中每个分子都一模一样。埃里克让两类分子切割一种新的RNA。他用一个硫原子取代了原先的RNA链上的一个磷原子,如此一来,酶的工作艰难了许多。埃里克用复制-选择的方式分别处理两组分子,让它们各自经历模拟的进化过程。但他现在只选择能够切割新RNA链的分子,接下来他想知道,四散在基因型网络上的第一类分子和集中在基因型网络一处的第二类分子,到底哪类分子上手新任务的速度更快。

如果基因型网络有助于分子进化,那么第一类分子应该做得更好,因为第一类分子能在RNA图书馆里探索更多社区。这正是埃里克的发现。他在多样的混合分子里发现了一个RNA酶,这个核酸酶执行新任务的效率比单一的第二类分子中的核酸酶高8倍。

埃里克的实验还有一个额外的惊喜。我们是在测定那个效率奇高的新分子的序列时意外发现的。

很多研究人员已经研究过我们实验开始时用的RNA酶。这个分子很小,只有大约200个核苷酸。我们知道相关核苷酸序列、折叠方式、相关功能以及作用原理。大部分你可能想了解的内容我们都知道。在酶分子的数轮复制中,我们都精确控制了分子进化的环境,甚至精确到每个分子的浓度。既然对全局有了近乎周详的掌控,你可能会觉得我们应该能预测分子会做出怎样的改变来适应新任务。就像如果你彻底了解一架机器,了解机器上的每一个齿轮、每一个螺钉、每一根杠杆、每一根弹簧以及它们的协作方式,你肯定也知道改进这架机器的最佳办法。

但是我们不知道。我们完全无法预测大自然究竟会如何改进实验中的酶分子。直到今天,我们仍然没有完全理解为什么这样改进的效果最好。

实验室里模拟进化的实验常常出现意外。不论我们对一个分子研究得多透彻,不论实验多简单,不论控制得多精确,自然总是出人意料。哪怕是最简单的酶,也比大多数人类制造的机器要复杂难懂得多。

虽然我们在预测最佳结论上毫无建树,但也没有空手而归,我们现在已经知道基因型网络可以加速生物种群进化的速度。这个结论正中要害,虽然我们无法预测某个个体的新性状,但这并不妨碍我们在种群层面上对于进化的研究。

科学袪魅自然,确定自然法则,剥夺人对世界的惊奇和敬畏之心,这让很多伪科学人士深感困扰。用诗人约翰·济慈(John Keats)的话来说,科学家是群扫兴的人,“使天使折翼”(clip an Angel's wings)、“拆开彩虹”(unweave a rainbow)。达尔文理论之所以不被接受,这种情感当然也是原因之一,不过上述实验表明,我们依然可以想到两全其美的办法。科学能够解释进化的普遍原则,但是不能预测单个进化。理解进化的能力丝毫不会影响进化的魔力。这本身就是我们对自然保持惊奇和敬畏的理由。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈