1944年,诺贝尔物理学奖得主、理论物理学家埃尔温·薛定谔(Erwin Schrödinger)出版了《生命是什么》(What is life),书中收录了他所做的一系列演讲。在那个沃森和克里克还没有发现DNA双螺旋模型的年代,薛定谔已经开始尝试从物理学的角度解释所谓的生物进化。《生命是什么》一书虽然篇幅不长,但是充满了真知灼见。这些洞见中有一个一直受到主流科学界的广泛认可:进化增加了有序性,减少了无序性,或者用薛定谔自己的话说,叫“负熵”(negative entropy)。
4年后,美国电气工程师克劳德·香农(Claude Shannon)把本来只在热力学领域使用的概念“熵”(entropy),借用到了电报的信息传输精度问题中。于是,进化和信息之间的关系就被建立起来了,只不过这种关系的表述非常简单粗糙:无序——不好,有序——好;正熵——不好,负熵——这时候也叫信息——好。
自从薛定谔出版了《生命是什么》,我们对熵的理解就开始变得更加复杂而严谨。有序性和信息传递一直都是生物进化的中心议题,但是近几年来,基于对基因型网络的认识,我们发现,完美的有序性和彻底的无序性一样,对生物进化而言都有害无益。无序性对自然来说并不一定意味着负担,它同样可以帮助自然界的生物发现新的代谢方式、新的调控环路和新的生物大分子。简而言之,无序性也可以帮助生物进化。
我们再拿乐高积木来打个比方。乐高积木可以根据孩子的想象力随意拼接,当然,这些我们熟悉的塑料块也可以根据预先设计好的“图纸”拼出特定的形象。例如乐高公司可能会给孩子们提供一张图纸,只要他们按照图纸上的步骤就能拼出一艘海盗船。无序的拼接比照搬图纸更有可能创造出新的形象,这种潜力一方面要归功于孩子们丰富的想象力,而另一方面则是因为乐高积木有许多可能的海盗船拼法,远远不止说明书上列出的那些。
同样的原理在生物学上表现为自然界的基因型网络,即相同表现型的不同基因型集合,比如鳕鱼体内的抗冻蛋白。在更隐晦的层面上,基因型网络的存在牵涉到一个广泛存在的生物学概念,但是这个概念曾长期被人忽视,直到20世纪末才引起科学家的注意,这个概念就是发育稳态(robustness)。发育稳态指面对外界环境时生物体保持自身特征稳定的能力。
要理解生物学中发育稳态的真正含义,最好的例子莫过于把传统印刷出版物和计算机程序中的输入错误进行比较。如果在一本书里看到这么一段文字:
N smll stp fr mn, n gnt lp fr mnknd[18]
读者可能会眉毛一扬,然后若无其事地继续往下读,因为对于一本书而言,这么一小段文字乱码几乎不会影响对整本书的理解和阅读体验。然而在计算机程序里就不一样了,对于动辙几千行的代码来说,不要说字符,哪怕是一个逗号的丢失都有可能让价值数百万美元的程序崩溃。在现实生活中,类似的程序错误每年都要造成数十亿美元的经济损失。相较而言,我们可以说,人类的语言具有很强的发育稳态,而计算机的程序语言则没有。
生物具有发育稳态的猜测最早可以追溯到20世纪40年代,当时的生物学家兼哲学家沃丁顿(C. H. Waddington)在研究果蝇时发现,不同基因型的果蝇在身体外观上几乎没有区别。沃丁顿用于观测比较的指标非常精细,例如果蝇翅膀上的脉络以及背部的刚毛数目。沃丁顿根据这种现象认为,“发育无论在什么情况下都会止于一个相同的最终结果”,并将其定义为限渠道化(canalization)——这个词表达的含义与发育稳态相同。沃丁顿的研究暗示,果蝇的形态对基因突变具有一定的耐受性,即同一个身体性状背后的基因型可以有很多种。即便如此,对于发育稳态的研究在此后的半个世纪里仍旧是一潭无人问津的死水。
到了20世纪90年代,当时的分子生物学家们深受一个问题的困扰:他们发现许多基因根本没有任何实际作用。这个表面上看起来与沃丁顿的研究没有任何关系的现象,让发育稳态这个概念几乎在一夜之间就涌入了主流科学界的视野。
科学家们想不明白的是,既然这些基因没有用,那么它们为什么没有消失呢?这些无用基因的存在浪费了宝贵的资源,不断积累的DNA突变应当将它们抹去。就像一栋被人弃用的大楼,年深日久,最后必定会归于尘土。
我们在第5章中提到过啤酒酵母,除了用来酿酒,它对细胞生物学的重要性犹如果蝇之于胚胎学。正是在对这种啤酒酵母完成全基因组测序后,科学家们才发现了众多的“无用基因”。手握酵母的整个基因组,科学家们意识到,他们对基因组中数千个基因在酵母生命中扮演的角色一无所知。为了了解每个基因的作用,科学家们对酵母的基因进行了逐个“敲除”(knockout),之所以这么命名,是因为科学家每次只删除基因组里的一个基因,相当于从基因组的书里删除某个表意完整的特定段落。
这个研究的逻辑就像通过每次去掉汽车的某一部件,从而分析该部件在汽车里的作用一样:如果你拆掉车的圆盘转子再踩刹车踏板,发现车不能减速,那么你就能猜到转子和汽车的刹车有关系。同样的道理,如果敲除某个基因后酵母不再分裂,那么这个基因就和细胞的分裂有关。而如果被敲除某个基因后的果蝇失去了翅膀,那么这个基因就参与了果蝇翅膀的发育。
随着一个又一个有关基因的科学论文发表,基因敲除技术发展到今天,已经强大到能够敲除数千个不同的基因。斯坦福大学的研究者们在20世纪90年代首创了这种惊人的研究方法,他们在获得酵母基因组所有的基因测序结果后,决定逐个敲除它们。研究人员创造了6 000多种不同的酵母变种,然后把它们培养在未突变菌株能够生存的环境里,检测所有变种存在的特定缺陷,以此推断敲除基因的可能功能。
研究人员的发现出乎所有人意料。大多数变种在培养基里没有表现出明显的缺陷,它们与非变种一样生长旺盛。这也就是说,大多数敲除的基因没有什么实际作用。以此为开端,科学家在许多其他物种中干预了无数基因的表达。而得到的结论是,基因就像一句不含一个韵母就写成的句子:生命如同人类的语言,有很强的发育稳态,因此能够耐受实验中多数的基因敲除。
这样的结论引发了更多的疑问,其中之一便是,为什么会这样?发育稳态背后的原理是什么?
对于某些基因来说,发育稳态的原理简单明了。在基因组里,一些基因往往存在多个拷贝,就像有人在影印书籍的时候不小心把某一页重复印了两次。基因重复通常发生在DNA复制和修复的过程中,而且并不少见:人类基因组中大约有一半的基因都存在重复。由于重复的基因有相同的作用,所以当其中一个基因被敲除时,其他的拷贝就能够补上空缺。就像医院里防备停电的备用电源、用于备份数据的计算机硬盘或者商业航班中防止坠机的备用电路一样,如果不需要这些基因补上空缺,那么它们就一直都是“无用”的。
但鉴于多数“无用基因”没有复制——它们是单拷贝基因。因此,对这些基因而言,发育稳态现象并没有上述那么容易解释。
对于多数单拷贝基因,我们知道有一种情况可以解释它们的无用性,而这种情况普遍存在于催化代谢的酶中。生物体内的生化反应网络有点儿类似于城市中心的密集交通网络,比如曼哈顿市中心纵横交错的公路和街道。一名位于第二大道42号街的司机如果想去第七大道的48号街,可以选择北边东西走向的6条街道以及西边南北走向的7条街道中的任意组合。城市里的每条主路通常都有数条车道,车道越多,备选的前进路线就越多,就算有一条车道堵死,司机也可以选择走其他车道。不过即便整条路都堵住了也不是什么大事,因为司机总能够在四通八达的网络里找到其他路径,而经验丰富的老司机甚至能够通过出入两条相同走向的大街中间的停车场抄近路。这样的绕行虽然拖延了时间,但是不至于让人止步不前。
敲除某个与代谢有关的基因就像堵死了某一条主路,阻碍了代谢的原料进入生化反应的错综网络。而一条备用的代谢通路就是一条可以迂回的支路,位于断点位置后方的生化反应很快就会消耗完先前积累的分子,所以生物体需要绕过原先的通路,找到一个合成原料的支路继续反应,确保生命在代谢的城市里畅行无阻。这可不仅仅是一个抽象的比喻而已。生物工程学家能够用敲除代谢相关基因的方式阻断特定的通路,而当他们这么做时,生物体往往能够重新分配原料物质的走向,保证必需物质的合成从而存活下去。对于代谢而言,支路反应的存在甚至比单纯的后备基因更重要。
当然,发育稳态不仅仅局限在代谢或是基因组的水平。在单个蛋白质中这种现象同样普遍存在。比如溶菌酶(lysozyme),这种蛋白质通过摧毁可以保护细菌的细胞壁杀死它们。溶菌酶不仅存在于人类的唾液、眼泪和母乳中,而且还广泛存在于许多其他动物体内,某些攻击细菌的病毒也包含溶菌酶。当科学家想弄清楚这种蛋白质如何工作时,他们采用的方法类似于从基因组中敲除基因的研究,只是动作要小得多:他们改变蛋白质内氨基酸链上的一个氨基酸,然后观察这种改变的后果。
在获得超过2 000种溶菌酶的变种之后,他们发现其中大约有1 600种依旧能够杀死细菌,每一种变种内都只有一个氨基酸发生了改变。也就是超过80%的溶菌酶变种在更改了某个氨基酸之后,依旧具有杀菌作用。以溶菌酶为代表的蛋白质,就像代谢一样,具有很强的发育稳态。同样的情况也适用于调控环路——我们已经提过大肠杆菌的调控环路在实验室中经过大刀阔斧的改造后功能依旧不发生改变的情况了。
发育稳态最明显的优势在于保证生物的生存。这种作用可以追溯到第一个能够自我复制的RNA出现,微小的复制错误会在RNA传代中不断积累直到复制无法进行,而发育稳态则能够帮助RNA对抗致命的复制错误。这是现实版的“第二十二条军规”[19]:RNA分子必须在复制中尽量减少错误来保持自己在复制中不出错的能力。不过现代的RNA只需要些许的发育稳态就能显著降低复制错误的发生率:因为些许错误很难改变这种稳定的分子的自我复制能力,发育稳态为RNA分子发生复制错误后提供了稳定复制的喘息时间,而在这段时间内可能会有更好的自我复制分子横空出世。
发育稳态的重要性远远不止于此,它还可以用于解释基因型网络和进化的动力。
让我们重新回到我们拜访过的自然图书馆,在那里,每个代谢(每种蛋白质或者每个调控环路)都与某一馆内的馆藏相对应,而与每一本馆藏相邻的馆藏都只与它相差一个字母,这个不同的字母可以是一个生化反应,也可以是一个酶或编码这个酶的基因。我们从敲除基因的实验里得知,例如通过基因敲除阻断某个代谢反应,许多这样的基因修改都不会对生物造成可见的不良后果。也就是说,至少对于生物体直观可见的特征而言,即便基因型发生变化,生物的表现型也不一定随之改变,我们称这样的现象为发育稳态。而发育稳态的强度则由馆藏所在的社区大小来衡量,即每次只促成一个微小的改变而表现型保持不变的可能性大小。
社区里相同表现型的馆藏越多,生物的发育稳态就越强。如果我们假设生物不具有这种发育稳态,你就能看到它带给生物的优势:如果一种代谢、一个蛋白质或者一个调控环路没有任何邻里,它和它控制的表现型将极度孤立无援,弱不禁风。而在另一个极端上,如果所有微小的改变都能够保持表现型的一致,那么发育稳态的强度将达到峰值:任何单独的微小变异都不能改变这种性状。
无论是极端脆弱还是极端稳定,在现实世界中都不存在。没有哪个生物的哪个性状是绝对脆弱的,也没有哪个性状是绝对稳定的。所有的生物,它们所具有的结构和行为,都在一定程度上具有发育稳态。正是这种稳态赋予了不同生物种群探索巨大的自然图书馆的能力。图书馆中相同主题和内容的馆藏数量惊人,但每个主题的馆藏都仅仅是图书馆内无数书籍中的一小部分而已,自然图书馆就像海洋,相同主题的馆藏仅仅是海洋里的一滴水,而每个文本不过是组成这滴水的水分子而已。
如果没有发育稳态,图书馆中依旧可能会有许多主题相同的书,但是它们相互之间都会相距甚远,毫无瓜葛。没有读者能够在一本书附近的馆藏里,找到探讨类似主题的书,它们之间往往只相差一页、一个单词甚至一个字母。相同表现型的不同基因型就像在夜空中眨着眼睛的星星,相互之间隔着以光年计的寂寥空间。
值得庆幸的是,生命的世界并不像宇宙。以任何一个文本作为起点,我们都可以选择这个文本的众多表意相同的相邻文本,再以同样的方式行进到下一个同样稳定的文本上,如此反复,而不改变我们需要的那个主题。用这种方式,生物体能够探索自然图书馆里未知的领域,并有机会发现新的性状。发育稳态使得表现型相同而基因型不同成为可能。由此,大自然可以在发育稳态所创建的基因型网络里琢磨新的乐高积木拼法。
我们在第2章中提到过自组织系统,自组织的原则在生物界和非生物界都普遍存在,从星系的形成到生物膜的组装都涉及自组织,而基因型网络恰好就是这种系统的又一个例子,但它又是比较特殊的那一个。基因型网络和星系不同,星系的形成依赖宇宙空间中物质之间的引力作用,而生物膜的自动组装则有赖于脂质分子与水分子之间的亲疏关系,但是基因型网络并不会随着时间的流逝而改变,它们是格局无限大的自然图书馆中的常住居民。
即便如此,基因型网络具有某种组织性的事实仍毋庸置疑。由于它的组织形式复杂,我们到今天也不过是略知皮毛而已。但是我们可以肯定,基因型网络具有自组织性。与星系形成和生物膜组装相比,基因型网络自组织性背后的原因要简单得多:因为生命具有发育稳态。对于基因型网络而言,发育稳态一方面不可或缺,否则表现型相同的不同基因型将被孤立;另一方面,发育稳态也别无他求。只要代谢、蛋白质和调控环路具有一定的发育稳态,基因型网络就可以在宇宙中生根发芽。
发育稳态足以维持基因型网络的存在,但是仅有基因型网络对进化而言还远远不够。原因在于,进化的发生必须要同时满足两个看起来相互矛盾的条件。进化需要生物同时具有保守性和可变性。就像当初那些企图横渡大西洋的先锋飞行员一样,他们也需要参考莱特兄弟的飞机原型:他们要的是能够完成这项壮举的新飞行器,但是他们同样需要学习如何让不够完美的旧飞行器在天上翱翔,直到新一代飞行器取而代之。同样的道理在自然界也适用,大自然需要保证生物的存活,同时寻求新的性状。基因型网络为探索新性状提供了便利,但是网络本身对保留已有的性状并没有什么助益。
我们需要再次强调这一点,因为基因型网络的发现让我们在惊喜兴奋之余,也容易冲昏我们的头脑,忘记自然选择所扮演的重要角色。自然选择的作用体现在它的保守性,它是进化的记忆,保留了所有值得保留的改进,无论改进多么微不足道,假以时日,这些微小的改变终会积流成河,聚木成林。我这样说也是有据可依的。达尔文在他的物种起源中有一段关于眼睛的描写,眼睛无疑是生物进化史上最出色的成果之一。“眼球精密的结构是无与伦比的,它能够调节焦距以适应不同距离,能够调节进出的光量,能够纠正色差和球面像差,我必须坦陈,造就这一切的自然选择对我而言简直不可思议。”
当光线穿过我们的眼球,眼球中的棱镜系统就把外面的世界清晰地投射到了可以感应光线的视网膜上。这听起来简单,不过在这个过程中,眼球必须以精密的角度改变光线前进的路线。对光进行折射可不仅仅是改变晶状体的形状就能做到的,构成晶状体本身的材料常常被忽略,而它对成像而言至关重要。晶状体的组成成分由来已久,它的出现依赖于新的调控通路。
向水的表面投射一束光线,你能够在水面与空气交界的地方看到光线的弯折。如果在水里溶入糖,那么光线弯折的角度会变得更小[20]。溶解的糖越多,折角越小。食品工业正是利用这个原理检测酒、软饮和果汁中的糖含量。我们的眼睛也利用相同的原理对光线进行折射,区别在于眼睛利用的是蛋白质而不是糖。这种蛋白质(晶状体蛋白)在晶状体中有极高的浓度,使得晶状体对光线具有极强的折射能力。
晶状体蛋白在光线折射方面的作用惊人的出色,很容易让人以为它的存在是为晶状体的形成而量身定制的。然而,事实并非如此。许多晶状体蛋白都是参与代谢的酶,除了数量上相对较少以外,它们和身体中参与其他生化反应的酶相比,并没有明显的特殊之处。不同的生物利用不同的酶作为晶状体的蛋白成分。这些酶与其他蛋白质的一个不同在于,它们不容易凝结成块,哪怕在眼球内以高浓度的形式聚集也不会轻易析出。
眼球利用的蛋白质本质上是一种酶,但它不要求这些蛋白质能够像乙醇酶一样分解酒精,只因为它们是透明的,就像你找了一块破砖头做书立不过是因为它碰巧很沉而已。此外,晶状体蛋白往往非常稳定坚韧,人类眼球中构成晶状体的晶体蛋白往往将伴随一个人的一生,从出生直到去世。但是有的时候晶体蛋白也会出问题并凝结析出,使晶状体呈现乳白色。这就是我们所说的白内障,白内障最终必然致盲的结果人尽皆知。
达尔文本人无缘得知任何关于蛋白质化学领域的知识,但是他做出了大胆的假设,他认为脊椎动物美丽的眼睛,以及眼睛内精妙复杂的晶状体,都是一系列微小进化积累的最终产物,这一洞见已被今天的我们所证实。早在我们的祖先选择不易析出的代谢蛋白作为晶体蛋白之前,它们的祖先(某些蠕虫或是海星)就已经开始利用感光细胞了,这些感光细胞的作用可以帮助它们找到阴影下的藏身之地以躲避掠食者。
数百万年之后,感光细胞逐渐聚集在一个浅浅的凹陷内,形成视杯(eyecups)。视杯能够比感光细胞更好地感受光源的方向,视杯进一步凹陷就成了视坑(pit eyes),视坑对于光源的感应已经相当出色。再进一步,视坑逐渐进化成视孔(pinhole),视孔终于能够真正意义上地进行成像了。到此,眼球的形成只差一种能够折光的高浓度透明组织就完成了,比如晶状体蛋白。此时,距离晶状体的出现只有一步之遥。我们最终在眼睛的结构里看到了能够移动和变形的晶状体,因为有了它,眼球才能呈现清晰的物像。
每一个小小的改变和进步都值得被保留,而自然选择的确也做到了。之所以如此肯定,是因为许多动物身上依旧保留有这些改变:某些扁形动物中还保留着视杯,蜗牛身上仍旧存在视坑,而鹦鹉螺——一种贝壳体分为许多小室的乌贼近亲,身上则有视孔,而水母等动物身上则具有相对简单的原始晶状体。
在气势宏伟的中世纪大教堂中,教堂里高耸的尖顶和巨石雕琢的厚重圆柱都会配以无比精致的装饰,高高的拱形屋顶往往超出了我们的视线范围,掩映在半明半暗之中。而由所有这些细节构成的最终成品,如果没有人告诉你它们是一块砖一块砖修筑起来的,你也许很难相信世间竟能有此等杰作。而我们的眼睛也是这样的杰作。
分子进化的过程亦是如此。北极鳕鱼体内的抗冻蛋白可不是像雅典娜[21]那样在一夜之间就形成的。北极鳕鱼祖先体内的某种蛋白质以一次一个氨基酸的速度缓慢积累着有益的变异,每次变异只要把体内液体的凝固点降低仅仅0.1摄氏度,其后代的生活范围就可以向外扩展数公里。更大的生存空间也意味着数量更多和种类更丰富的食物供给。只要是能带来生存优势的突变就具有保留价值,而一系列类似变异的积累则把鳕鱼的生存极限延伸到了极度低温的疆域里。基因型网络对于寻找新性状至关重要,而自然选择则是新性状的保留者。
通过数量积累逐步改良生物性状的突变对生物进化来说至关重要,不过这并不是DNA改变的唯一方式。许多突变在首次出现时对生物往往既没有好处也没有坏处。这种中性的突变需要归功于发育稳态,发育稳态使得生物体对错误有了一定的耐受性。
中性突变对进化或许也很重要,至于为什么,我们至今仍不甚明了。事实上,有关自然选择与中性突变的争论由来已久,在20世纪的最后30多年里,中性突变一直是达尔文主义者的眼中钉、肉中刺。分子生物学领域的技术革命在自然界的生物体中发现了数量惊人的基因多样性,从哺乳动物到果蝇,甚至微观的细菌:同一个物种体内的数千个基因往往在不同个体之间存在DNA序列上的差异。多数科学家相信,这些多样的基因都是自然选择的结果,而持有这些看法的科学家往往是忠诚的达尔文主义者。他们认为,既然多样的基因得以保留,说明同一个基因的多样化有助于生物的生存和繁殖。
但是这些自然选择论者却遭到了一个来自少数派的微弱的反对声音,他们就是中性主义者。中性主义者认为,大多数的突变对生物体没有任何改变,因此也不会受到自然选择的影响。至少在这些突变首次出现时,它们是绝对中性的。在某些科学家眼中,比如古生物学家史蒂芬·杰伊·古尔德(Stephen Jay Gould),中性突变的存在极大削弱了自然选择在生物进化和新性状形成中的作用。
科学和技术的发展史为中性突变提供了一个不甚恰当的类比对象,即新理论和技术发明之初往往找不到自己的定位,但是它们的价值有可能在未来某个时刻变得不可估量。数论就是一个很好的例子。数论是数学的一个分支,美国数学家伦纳德·迪克森(Leonard Dickson)曾经不止一次说过:“感谢上苍,数论没有被任何应用技术所玷污。”从欧几里得开始直到1919年,这句话都没有什么问题。但是在仅仅几十年之后,数论就因为一个完全不相干的领域而被放在了互联网经济的中心位置。
随着数字计算机和互联网技术的发展,数论被用于网络信息的加密,为电子金融和网上银行业务保驾护航。类似的例子还有很多,德国物理学家海因里希·赫兹(Heinrich Hertz)通过实验验证了由詹姆斯·克拉克·麦克斯韦提出的电磁理论,但是赫兹本人也说不出这个理论到底有什么应用价值。赫兹曾经不停地跟别人说他的实验“一点儿用都没有”,“只不过证明了大师麦克斯韦的理论是正确的而已”。而在短短40年之后,赫兹的实验促成了世界上第一座获得商业许可的广播站建立,即位于匹兹堡的KDKA,这个无线电台至今仍在1 020千赫的频段上播送节目。
中性学说最著名的支持者莫过于日本科学家木村资生(Motoo Kimura),木村资生建立了一套复杂而成功的数学理论,以评估中性突变在进化上的命运。木村资生主张自然界大部分的遗传突变都是中性的。不过在基因组学时代到来的今天,我们已经知道,木村在这一点上的认识是错误的,中性突变并没有比那些带来优势的突变更多。撇开这点不谈,木村认为中性突变十分重要的观点则是完全正确的,尽管我们又花了数十年时间才理解中性突变之所以重要的原因。
第一个原因是,中性突变在探索基因型网络时非常重要。中性突变为读者在自然图书馆中寻找新性状时铺就了一条安全的道路,避开了一路上诸多无意义的伪作。如果没有基因型网络和中性突变,安全探索自然图书馆几乎是不可能的。
第二个原因是,以中性突变出现的变异不一定永远是中性的。中性突变同样可以在某一天成为有意义的突变,就像曾经毫无应用的数论那样。一旦中性突变表现出有利于生物生存的性状,它们就会被自然选择保留下来。换句话说,自然选择学说和中性学说都没有错,自然选择和中性突变都是生物进化中的必要组成部分。中性突变先为新性状的出现铺路,而自然选择从众多的中性突变里选出具有进化潜力的那些突变。
一个很好的例子是受到广泛研究的RNA酶,它很好地展示了中性突变和基因型网络能够在多大程度上加快新性状进化的速度。这种特殊的RNA酶作用于RNA链上的特定位置,在所识别的位点上对RNA进行切割。这种核酶的形状犹如它的名字,就像一条双鳍鲨,独特的锤头状是它执行功能的关键——这是一个充分不必要条件。在广阔无边的自然图书馆里,同样催化活性的其他RNA分子很可能有着不同的形状、不同的表现型,从而使得核酶剪切RNA的刀刃更加锋利。
如果没有基因型网络的存在,那么RNA图书馆里的一小簇读者,也就是某一簇进化的RNA分子,必须聚集在“43核苷酸区”里,它的脚步只能延伸到相差一个核苷酸的馆藏里。按照这个范围,某种特定的RNA酶只有129个不同的相邻RNA。由于我们能够计算每一种RNA的形状,所以我们知道这129个RNA一共有46种不同的形状,这也是进化在不借助基因型网络的前提下能够触及的分子形状数目。
如果我们继续下去呢?如果只选择那些突变是中性的相邻RNA,也就是同样是锤头形状的邻居分子,并检验它们的相邻RNA,这样我们就能得到962种新形状。而后我们再深入一步,检查那些相邻RNA里中性突变的相邻RNA,这次我们将得到1 752种新形状。仅仅在基因型网络中深入两步,新的分子形状数量就比核酶直接相邻的RNA多出了将近40倍。而沿着锤头状这个分子特征前进的基因型网络支路远远不止这两步,这张网络中有超过1019种RNA,现有的计算机还没有能力对所有相邻RNA的分子形状进行推演。不过我们几乎可以肯定,在这些RNA中有数十亿种新的分子形状,而且这些形状不同的分子都具有相同的功能,因为在进化过程中,保证生物的生存本身就是基因型网络存在的意义。
这就是基因型网络加速进化的方式。基因型网络就像科幻小说《星际迷航》中用来进行超光速星际旅行的曲速引擎。如果没有基因型网络的存在,那么锤头状核酶的进化速度将放缓至现有速度的1/40。与已经进化了将近40亿年的现代生命相比,如果没有基因型网络的帮助,地球生命相当于才刚刚走完第一个一亿年的路。在生命出现最初的一亿年里,地球上可能已经有了为数不多的几种细菌,但是多细胞生物肯定还没有登上历史的舞台,更不用说鱼类、陆生植物、恐龙或者人类了。基因型网络对生物进化的加速远远超过40倍,确切的数字我们甚至都无从计算。如果没有这张基因型网络,地球上的生物可能到今天都还没有爬出那盆原始浓汤。
在《星际迷航》中除了曲速引擎,还有一种实现超光速飞行的方式:直接改变宇宙空间。创意无限的科幻作家们创造了许多新奇的技术,比如虫洞(wormhole)。虫洞让数千光年的旅程在一瞬间就能完成,而我们发现基因型网络的作用也与之相似。基因型网络缩短了图书馆内两部馆藏之间的距离,无论这座图书馆是代谢、蛋白质还是调控环路图书馆,基因型网络都发挥了这个作用。
我们来想象有一群参观图书馆的读者,它们是某个物种的一个种群,它们聚集在某个文本周围。这个文本叙述了一个特定的调控环路,而该环路控制的基因表达谱会参与身体某些部位的发育,比如鸟类的翅膀。我们再假设在这座图书馆的某个角落里另有一本书,它叙述的调控环路和基因表达谱,能够让翅膀的空气动力学和重量都得到些微优化。这本书藏得越深,读者想要找到它所花的时间就会越多。
在规模如此惊人的图书馆里寻找某本特定的书犹如大海捞针。你当然可以找到那本书,不过前提可能是你要走遍海里的大部分地方,可能你要走遍每一个角落才能成功。只不过相比某个特定的表达谱而言,图书馆的规模更像是宇宙而不是大海。常识告诉我们,要捞起这根针,我们将不得不走遍宇宙的每个角落。
但是自然图书馆从来不落俗套。这一点在我们发现不同的调控环路能够控制相同的基因表达谱时就已经略有涉及了。我们知道,大海里的针往往不止一根。而当我们在图书馆里寻找特定表达谱的调控环路时,却发现自然图书馆比我们原先认为的更加怪异。在这项研究中,我们首先以随机的方式设计出数千种基因表达谱,而后用计算机针对每一个表达谱生成一对调控环路。两个环路中的其中一个与目标表达谱对应,而另一个则不然。除了所控制的表达谱,每对环路内基因之间的作用关系也不尽相同。接下来,我们逐渐改变第一个调控环路里的基因的作用关系,一次改变一个并保证环路所控制的基因表达谱不变。
经过足够多次的操作,第一个环路能够与配对的环路变得类似吗?答案是,可以。我们的研究发现,对于含有20个基因的调控环路来说,配对环路中基因相互作用形式的相似性能够达到85%。换句话说,以图书馆内任何位置作为起点,你不需要长途跋涉,只要脱离基因型网络走出去15步就能到达另一个基因型网络。也就是说,无论你从大海里的哪个位置开始寻找,你要找的针总是在你周围。
如果这还不够让你觉得新奇,那么我们来看看更诡异的东西。
我们假设自然图书馆就是图6-1中的正方形,正方形中的黑点是某个文本。围绕黑点的圆圈,它的半径相当于正方形边长的15%。这是读者要从一种表达谱到达某个新基因型网络的平均距离,15%这个数值来源于我们上述所做的研究。我们来做一个简单的算数,如果圆的半径是15厘米,那么正方形的边长就是100厘米,圆的面积约为707平方厘米,差不多相当于正方形总面积的7%。
图6-1 自然图书馆与基因文本关系示意图
当然,现实生活中的图书馆不是二维的,它们都存在于三维空间。出于简化考虑,我们把图书馆抽象为一个立方体,那么在这种情况下,一个表达谱所在的社区就相当于一个球。球的半径依旧根据立方体边长的15%设定,但是两者的体积之比却发生了变化。球的体积不再是立方体体积的7%了,而是1.4%。
而调控环路图书馆甚至连三维、四维图书馆都不是。它们位于更高维度的空间,在那里,图书馆是超立方体,社区则是超球体。在四维空间中,超球体是超立方体体积的0.2%。而五维空间中,超球体是超立方体体积的0.04%。
在调控环路所处的高维空间中,这个比例超出你的心理预期。超球体与超立方体的体积比不是0.1%,也不是0.01%。而是仅有10-100%。对于图书馆里的读者而言,要从一个文本出发寻找新的基因型网络,只需要探索一块微不足道的区域。高维空间体积比例不断缩小源于一个简单的几何规律:越高维的空间内,半径为边长恒定比例的超球体在超立方体中所占的比例总是越小。体积比例的下降不是因为我们所举的例子中的半径边长比为15%,不管这个比例为多少,哪怕是高达75%,三维空间中球体与立方体的比例也会降为49%,在四维空间中降为28%,在五维空间中进一步降为14.7%。随着维度升高,比例越来越小。
其他图书馆里同样存在这种反直觉的现象:图书馆所处的维度越高,也就是说,馆内的代谢和分子种类越多,找到新性状的难度也就越小。生物一旦在自然界站稳脚跟,想要再寻找新的性状并不需要花费太多力气,它们只要改变少数几个生化反应,探索代谢图书馆的一小块区域,就可以撞见它们所期盼的新性状。对于RNA而言也是同样的道理。以一个已有的RNA作为起点,你只要稍稍改变它的核苷酸就能够获得形状不同的新分子。在图书馆里寻找新性状的代价不过是回身走两步而已。
适者降临的代价仅仅是探索自然图书馆的10-100%,如此看来,自然界依靠略显盲目的探索方式却依然能够造就生物丰富的多样性也就不奇怪了。进化不用遍寻海底的每个角落,因为遗落在海底的针远远不止一根。事实上,海底散落的针都在一张紧密编织的网里,而这一切都要归功于发育稳态和它对基因变异的耐受性。
不知道你是不是已经有了这样的印象:图书馆中每个文本所在的社区规模都极其庞大。那么你大概也很容易理解,图书馆在构建组织上的另一个特征:每个基因型网络不但分布广泛,而且不同的基因型网络之间还有频繁的交织互动。它们紧密交联,互相围绕,繁复多变。整个网络由数百万乃至数十亿根丝线织成,每根都对应一种特定的表现型。如果给每根丝线涂上一种独特的颜色,那么这张复杂无比的网络中的每一条丝线上都有数十亿根其他颜色的丝线交织而过。如此精致的绸缎只可能存在于高维空间中,它的华美与我们生活中的任何织物都不同,完全超出我们的想象。这张网隐藏在我们生活中的每个生命体背后,生命由它而生。
复杂交联的基因型网络都是发育稳态的产物,发育稳态对于进化而言至关重要。不过,天下没有免费的午餐,发育稳态也一样。发育稳态的代价就是它的复杂性。
想要声讨某个事物太过“复杂”似乎没有必要。在路易斯·卡罗尔的《爱丽丝梦游仙境2:镜中奇遇记》中,爱丽丝在探索一块神奇的棋盘时遭到了红衣骑士的攻击。所幸爱丽丝被红衣骑士的死对头白衣骑士及时救下。但没想到的是,白衣骑士是一名发明家,他迫不及待地要向爱丽丝展示他的发明,比如一个只要按一下底下的按钮就可以遮风挡雨的箱子,一个马背上用的捕鼠器,还有一个用吸墨纸、封蜡和火药做的甜点。
“你瞧啊,”白衣骑士稍稍停顿了一下,然后继续说,“所谓有备无患嘛。看看我的马戴的那些脚镯子。”
“它们有什么用?”爱丽丝饶有兴趣地问。
“以防鲨鱼的袭击,”骑士回答,“这是我的专利。”
白衣骑士深受复杂而奇葩的发明掣肘,沉重的累赘让他无法策马奔腾,无法陪伴爱丽丝继续她的旅程,理所当然地,白衣骑士很快就在故事里谢幕了。不过,他作为“大道至简”的反面典型,还一直活在读者的心中。
早在卡罗尔写完爱丽丝的故事之前,14世纪英国修道士“奥卡姆的威廉”(William of Ockham)一直都是精简主义的狂热信徒,他创立的精简原则在今天已经被视为简约性的定义:万物本质当由最少的事实作为支撑,切勿浪费。奥卡姆也把事实称为“实体”(entities),这个观点也被世人叫作“奥卡姆剃刀”(Ockham's Razor,也作Occam's Razor),它让人相信普世的科学理论往往形式简约。此外,奥卡姆剃刀也是工程师制造机械时的追求,虽然他们在工程学中已经有了更接地气的座右铭:KISS,即“还可以更精简,你个蠢货”(Keep it simple, stupid)。
奥卡姆剃刀不仅是出于美学或者哲学层面的追求,在工程学里,它还有着经济方面的考虑。量产一台机器的每个零件都需要成本,更少的零件意味着更低的成本,而降低成本是每个工厂老板都希望看到的。另外,装配过程复杂的机器也更容易出现安装错误。对于制造一台机器而言,精简主义大有裨益。
所有试图理解生命,却对它们的复杂性望而却步的生物学家,大概都会对精简主义心向往之。生命在很多方面似乎都复杂得没有必要。调节昆虫体节分化为14段的调控环路中有数十种分子,不过科学家从很多年前就了解到,只需要这数十种分子中的两种就可以实现同样的功能。昆虫体节分化的原理研究耗费了人类数十年的时间,自视甚高的人类工程师也只能对这些小虫子甘拜下风。不知道你是否还记得由生化代谢构成的交通网络,里面布满了备用车道、迂回路线以及平时不太常用的小巷子,以上这些现象都有一个相同的问题:为什么它们会存在?为什么优胜劣汰、效率为先的大自然会保留这些多余的复杂性呢?
答案是“环境”,确切地说,是“各色环境”。看似浪费的复杂性,实际上却是基因为了应对各种不同的环境留下的后手。
在营养极度贫瘠的环境里,大肠杆菌只能利用单一的碳源物质合成自身所需的必需成分,比如氨基酸和脱氧核苷酸。在这种情况下,大肠杆菌体内3/4的代谢反应都是无用的累赘。就算把它们都敲除,大肠杆菌照样能够生存,这就是发育稳态。
然而环境是复杂多变的。如果单一的碳源从葡萄糖变成了乙醇,原本“无用”的生化反应就成了大肠杆菌生命延续的关键。大肠杆菌能够利用80多种碳源合成必需成分,这些生化反应大多布局精巧。碳元素仅仅是生物所需的众多必需元素之一,其他元素的代谢需要进一步的生化过程。代谢反应类型的多样化有利于生物在多样的环境中生存。对于生物而言,高度的复杂性也就意味着对不同环境的高度适应性。
基因组中保留的重复基因同样是为了应对多变的环境。重复基因在诞生之初是完全相同的,不过它们不久之后就会踏上不同的命运之旅。突变会在各个基因内不断积累,改变它们的DNA序列和基因表现型,以便能够应对特定的环境。在人体内,某些催化分解反应的酶在肝脏中活性最强,而与之同源的另一些酶的最适宜化学环境则是在大脑中。而真菌中的一种在葡萄糖充裕时负责把糖分子转运入细胞的蛋白质,它的另一种同源蛋白则在葡萄糖稀缺时负责清除糖分子。许多重复基因的实际作用依旧是个谜,也许它们是在为某些还未遇到的特殊状况而蛰伏。
我们在工程技术领域也能够找到类似的例子。虽然工程师们对于精简主义相当推崇,但他们同时也要为多变的环境做足准备。比如,如果你只是想顺着河水随波逐流,那么你只要有一艘木筏足矣。如果你想去河对岸,那么你需要更复杂的设计以便控制木筏的前进方向,这时你又需要一个船舵。如果你不想被浪头打湿,你就需要在木筏上加装船身。而如果你想要逆流而上,就得给船装上船桨或船帆,哪怕是腓尼基人和埃及人在5 000年前就发明的横帆。原始归原始,横帆在船只顺风的情况下确实非常实用。相对而言,当风向改变时横帆就略显欠缺,而逆风情况下则会彻底沦为鸡肋。此时你就需要双纵帆:一面位于桅杆前方的三角帆和一面紧随其后的主帆。为了应对变幻莫测的暗流、大浪和风向,略显复杂的工程设备必不可少。
反过来道理也一样。至少在生物学领域,如果随着时间的推移环境一成不变,那么发育稳态相对而言就不那么重要了,遗传的复杂性也就会随之降低。对这一点我们不需要挖空心思,只需要看看家里养的盆栽就能够找到鲜活的例子。确切地说,这个例子是生长在植物上的某种昆虫。
蚜虫(Aphids),也叫木虱、腻虫或蜜虫[22],数千年来一直是农民和园丁不共戴天的死对头,尽管在总计4 000多种已知的蚜虫中只有100多种会吸食农作物的汁液。除了家里的景观植物,蚜虫的食物也包括棉花、各种果树以及谷类作物。蚜虫和19世纪40年代的爱尔兰大饥荒[23]以及50年代的法国葡萄酒庄园大虫害[24]也脱不了干系。蚜虫是最具破坏力的农作物寄生虫之一,但就其在科学研究中的地位而言,蚜虫的价值不可估量。蚜虫体内隐藏着一种更小的生物,它为我们上了有关发育稳态和遗传复杂性的宝贵一课。
许多人都知道蚜虫依靠吸食植物的汁液生存,但很少有人知道的是,植物汁液的营养并不丰富。植物汁液缺乏某些必需的物质成分,包括几种生物必需的氨基酸。为了弥补这个缺陷,蚜虫和一种大肠埃希氏菌的近亲组成了搭档。这种学名为Buchneraaphidicola的细菌主要栖息在蚜虫体内。
蚜虫和体内细菌的同盟关系使得它们可以同时受益,这种关系又被称为内互利共生,是一种高度亲密的共生关系。蚜虫体内的细菌不光栖息在蚜虫体内,而且直接栖息在蚜虫的细胞内。为了支付“房租”,它们为宿主细胞提供了救命的物质:合成必需的营养分子,尤其是蚜虫本身不能合成且在植物汁液中也无法摄取的必需氨基酸。对于蚜虫而言,体内的细菌就如同延续自身生命的工厂。
鉴于细菌的汗马功劳,蚜虫也会投桃报李。栖息在蚜虫细胞内的细菌简直就像漂游在一碗肉汤里,任何食物都伸手取用即可。除了食物,蚜虫细胞还为细菌提供了安全舒适的庇护所。身携细菌到处游走的蚜虫可以为细菌遮风挡雨,御寒保暖。与蚜虫共生的细菌不需要担心作物歉收,不用提防掠食者或者其他威胁,它们只要兢兢业业为宿主服务就能衣食无忧。蚜虫体内的细菌犹如一个与世隔绝的度假者,悠闲地徜徉在大海里,享受着阳光和沙滩,任凭一阵阵温柔的波浪晃动自己的身躯,消磨无聊的时光。
蚜虫体内共生菌的悠闲假期已经持续很久了。宿主和共生菌的首次碰面发生在大约一亿年前,两者一拍即合,从此以后便形影不离。经过一亿年的相伴,有人可能会猜测两种生物都发生了翻天覆地的变化。内生细菌的确变化惊人,通过研究它的进化我们还窥探到了些许发育稳态和遗传复杂性之间的关系。
我们将蚜虫内共生菌与它的近亲大肠埃希氏菌进行了一番比较。大肠埃希氏菌是代谢可塑性领域的大师,它能够利用各种不同的物质作为食物,对多变的环境有着极强的适应能力。大肠埃希氏菌复杂的代谢网络中包含了1 000多种化学反应,它们使得细菌在应对难以预料的环境时得心应手。
蚜虫体内共生菌的祖先曾经和大肠埃希氏菌不分伯仲。但是好景不长,如今它们的代谢网络中只剩下263种代谢反应。共生菌与蚜虫的同盟关系从恐龙还在陆地上行走的年代就已经开始了,从那时起,共生菌逐渐丧失了自身3/4的代谢反应,而这些反应中的大多数在大肠埃希氏菌中则得以保留。DNA复制错误的持续积累逐渐侵蚀代谢的基因,多数基因都没能挺过DNA的自我移除。而共生菌在无数次基因自我移除后仍旧幸存了下来。
蚜虫内共生菌能够幸存的原因几乎显而易见。多数的基因和代谢反应对于共生菌而言显得无用而多余,与大肠埃希氏菌不同,蚜虫内共生菌所生活的环境在过去一亿年中几乎没有发生任何改变。无论蚜虫如何用尽浑身解数,在不断改变的环境里挣扎求生,共生菌始终沐浴在单调的营养肉汤里。在如此单一的环境里生存,只要一种代谢模式就足够了。在这里,遗传上的复杂性不仅显得多余,甚至可以说是浪费。
蚜虫内共生菌非常特殊,但绝对不是绝无仅有,还有许多微生物也栖息在体型更大的生物体表或体内。它们中有的与宿主互帮互助,而有的则对宿主巧取豪夺。一个著名的例子就是人类体内的肺炎支原体(mycoplasma pneumoniae),它是轻度肺炎[25]的病原体,轻度肺炎患者通常不需要卧床休息。支原体在人体之间传播,依靠人类细胞获得食物,而它的代谢系统甚至比蚜虫体内的共生菌更简单:在营养充沛的人类细胞内,只拥有189种生化反应的支原体依然能够繁衍生息。
让人难以置信的是,支原体的代谢系统中包含了代谢世界中最古老的核心反应:三羧酸循环。此外,极端的精简性也让衣原体因祸得福,它不会畏惧以细胞壁合成酶为目标的抗生素,因为它早就连细胞壁都不合成了。衣原体甚至还会盗用人类细胞的生物膜,包裹并保护自身的细胞内容物。
与精简性相伴的则是发育稳态的降低:不仅仅是对突变,还有对于多变环境的稳定性,两者并非相互独立。对于基因敲除耐受的代谢方式,在多变的环境中同样较为稳定。如果大肠杆菌被限定生活在单一的环境里,例如只有葡萄糖作为唯一碳源,它只需要代谢系统中30%的生化反应就能够生存。但是蚜虫内共生菌则不同,它必须保证263种生化反应中超过90%的生化反应运作正常才能维持生存。只要抹除其中的某一个生化反应就足以抹杀这种生物。
从另一个角度来看,大肠杆菌的代谢网络里有很多备用的通路,而蚜虫内共生菌则没有,它的代谢系统就像一条没有岔路的单行道。只要在路上的某一处设置一个路障,整条路就会被堵得水泄不通。对于必需分子的合成而言,大肠杆菌对于DNA变异和环境改变都相当耐受,而蚜虫内共生菌则不然。
大肠杆菌和蚜虫内共生菌充其量只是代谢图书馆里的两粒飞尘而已,在它们身上适用的规律,即越是适应多变环境的生物在构造上越是复杂,在遗传上越稳定,可能并不是适用于所有生物的普遍法则。我们没有办法在实验室检验所有物种的代谢,不过依旧可以通过计算机演算相当数量的物种,这个研究的原理类似于民调:通过一个较小的随机样本反映一个较大整体的性质。我们选取一个随机样本,将不同的物种代谢置于不稳定的环境中并观察结果,就能够知道大肠杆菌和蚜虫内共生菌到底是自然界的代表还是奇葩。
为此,我所在实验室内的研究人员以尽可能精简的生化反应构建了数百个代谢网络,同时保证不影响生物的生存。我们把这种代谢网络称为最低代谢(minimal metabolisms),对最低代谢进行任何压缩都会导致生命无以为继。我们构建出的最低代谢有的能够在单一环境中生存,有的能在两种、三种甚至数十种环境中生存,每种化学环境之间的差距仅仅在于营养物质的种类。
这项研究的一个直接结论是,通常情况下,在不同环境中生存需要生物具有一定的复杂性。在某个实验中,我们研究了两种以不同物质作为硫源的环境,硫是一种和碳同样重要的元素。我们首先构建了最低代谢,能够保证生物在单一硫源环境中生存的最低代谢远远不止一种,这种代谢体系内只需要不到20个生化反应。而如果要支持生物在5种不同的硫源中生存,代谢体系内则至少需要25个生化反应。当硫源数量达到40种时,最低代谢的容量则扩展到了60个生化反应。换句话说,能够应付的环境类型越多,代谢体系内包含的生化反应就越多,代谢就越复杂。
这种情况下,代谢的发育稳态也会变得越强:我们能够从代谢体系中移除而不影响生物生存的反应相应也增多。代谢体系中的反应数量越多,在某个特定环境中不会用到的反应也就越多。“无用”的生化反应在某种环境中是中性的,但是在另一个环境中说不定就是不可或缺的。大肠杆菌和蚜虫内共生菌并不是特例,它们只不过是一个普遍规律的两个典型:生物的复杂性和遗传稳定性随着它所面对的环境多变程度的上升而上升。
至此,我们的认识越来越丰富。多变的环境催生了生物的复杂性,而复杂性促成了发育稳态,发育稳态继而造就了基因型网络,而基因型网络的存在让进化成为可能,使得生物能够通过演变适应环境的变化、提高自身的复杂性,循环往复,生物进化通过这种方式螺旋上升。这种进化方式的核心在于处在多维空间的基因型网络的自组织性。自组织性是生命绚烂光彩背后的支持者,它是隐藏的生命建筑师。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。