11生物高技术与数学技术
生物高技术是以分子遗传学的知识,应用各种现代技术,其中也包括数学技术,它可获得人类所需要的蛋白,用以医治疾病;改造动植物的品种;用基因来防治农作物的病虫害;用基因或细胞来治疗人的疾病等。
细胞是生命活动的基本单位,一个成年人大约由100万亿个细胞组成,细胞内由多种细胞器组成,通过膜系统相连,行使着不同的功能。如细胞核包含遗传特质DNA,控制着细胞的功能。线粒体是细胞内产生能源的“动力加工厂”,内质网和核糖体是蛋白质的“加工厂”。
每个细胞约含10亿个蛋白质分子,不同的蛋白质具有不同的功能,有些构成细胞骨架,有些具有酶活性等。细胞内蛋白质也进行新陈代谢,不断降解和合成。组成蛋白质的基本单位是氨基酸,不同的氨基酸靠共价键连成一条多肽链,多肽链相互折叠成具有空间构象的高级结构,执行着不同的生理功能。
蛋白质多肽链的氨基酸列构成特定信号,又称局部遗传信号,由其支配蛋白质穿越内壁网的膜通道,控制蛋白质进行细胞内定位的一系列的信号,这种信号类似于“地图”或“邮政编码”,引导着蛋白质进出细胞器官并准确地找到自己的位置。
细胞生长分裂时,产生大量蛋白质,并形成新的细胞器。蛋白质必须正确地定位分布,细胞才能发挥正常功能。人体的免疫系统在抗体产生时便利用局部遗传信号,使不同种类的抗体分布于不同的组织,各负其责,发挥着重要的防御功能,许多人类的遗传疾病就是由于这种信号和转运机制出错所致。原发性草酸尿症是由于蛋白质的分选信号改变导致蛋白质的定位出错,使人在早年便出现肾结石。某些家族性高胆固醇血症是由于运输信号缺失所致血中高胆固醇而引起的。这些对于阐明许多疾病的发病机理有极其重要的价值,包括囊性纤维化、早老性痴呆和获得性免疫缺陷综合征等。现今的许多药物都是以某种形式的蛋白质产生的。
生物高技术是以基因工程为核心的。基因是一种遗传物质,它的物质基础是脱氧核糖核酸(DNA),由两条DNA链形成双螺旋结构。DNA是由脱氧核苷酸连接而成单链,一个基因的DNA所含的核苷酸数目可多达数千至上百万。但是,核苷酸只有4种,即A、T、G、C。
成千上万的核苷酸可由A、T、G、C按不同的顺序排列,这种排列的顺序,叫做“序列”,虽然核苷酸仅有4种,但是长达成千上万个核苷酸所组成的DNA,可以排列出不知多少种序列。不同的序列,组成了不同的基因。
为什么基因的核苷酸序列会组成不同基因?因为基因的DNA序列,储存了“密码”,即每3个脱氧核苷酸决定一个氨基酸。核苷酸的序列如果是ATG,它决定了氨基酸是甲硫氨酸,ATT是异亮氨酸,ACT是苏氨酸,TAC是酷氨酸,TTT是苯丙氨酸……不同的核苷酸序列编成了20种氨基酸。不同的基因,有不同的DNA的序列,可编码不同序列的氨基酸所组成的多肽,这就是基因的遗传密码的奥秘。
人体应该有10万个基因,因此可编10万个蛋白,现在已经知道结构和功能的基因仅数千个(小于7 000个),还不到10%,所以说,人虽然可以上天,但对人本身的了解还刚开始。
基因的载体是DNA,它怎样制造出蛋白?原来基因是由两股DNA链的双螺旋结构所组成,它在行使它的功能前先要解开,暴露出单链,其中一条是有功能的链,叫正链。这条DNA链,可以通过一群酶的作用按它的核苷酸(A、T、G、C)的序列,合成一条RNA互补链。这条RNA链按(A、U、G、C)4种核苷酸的配对原则(A-U、T-A、G-C、C-G)配对,RNA上的相应序列是UCGAGGC……这样把DNA上包含的“信息”传递到它对应的RNA链上去,而且是精确无错误的。这个过程,正像将一盘磁带用录音机录制到一盘空白磁带上去,我们叫它为“转录”,唯一不同的是,母带上的信息是DNA,子带上的信息转为RNA,但是它携带的信息依然是正确无误的。原来RNA上所持有的信息,根据2个核苷酸决定1个氨基酸的原则,通过细胞质里一套“机器”可以把RNA的序列翻译成按一定的氨基酸序列排列的多肽。就这样,基因DNA通过“转录”成为RNA,最后由RNA“翻译”成蛋白。基因通过转录、翻译最后生产出蛋白,这个全过程称为“基因表达”。而基因表达的最终产物是蛋白,人之所以生长发育、健康生活,正是靠多少万个基因在表达各自的蛋白。人没有血红蛋白,就不能生存,所以血红蛋白的基因(称蛋白基因)先天出了毛病,就成为遗传病。现在知道,恶性肺瘤、高血压、糖尿病以至老年性痴呆都是基因发生了故障。但是,有多少个基因以及哪一种基因出了故障还不清楚。
把基因的编码序列放进一个“载体”中,加上启运基因表达(启动子)和增强它表达的元件(增强子)以及表达的终止元件,组成一个“金组体”,称为某个基因的表达载体。把它放进细胞中去,它就可产出所要的蛋白。这就是基因工程。
基因工程是把基因放进“体外”的系统,在细胞中表达出蛋白,经分离纯化后作为一种药物。基因治疗则是把基因直接导入人体或先导入人的细胞然后输入人体,用这种基因达到治病的目的。可惜,技术还不成熟。
前面已谈到基因表达出蛋白。蛋白质是组成生物有机体的基本大分子之一,其三维结构完全由其氨基酸序列决定。从氨基酸序列直接确定蛋白质结构,将有助于了解其结构与功能之间的关系。依此,可对现有蛋白质进行结构改进,进而有目的地改变其功能。例如设计艾滋病病毒反转录蛋白酶抑制剂,就必须对该酶蛋白质的结构有相当的了解。
1983年,有的学者就开始使用刚建立的遗传序列数据库,证明一种致癌基因曾是某种正常因子的近似物。此后纷纷利用数据库进行检索,许多学者还努力熟悉有关的数据库和算法,以便能有效地从大量数据中提取所需要的数据关系。现在生物学界面临三大问题:序列分析、信息存取、蛋白质结构预测。
现在通过网络有越来越多的蛋白质结构数据库和蛋白质结构预测服务站。这样,推动了计算分子生物学的发展。它的基本出发点是由DNA的蛋白质序列,通过计算机方法推导出其高级结构和功能信息。
弄清蛋白质结构,对了解其功能至关重要。目前,X射线衍射晶体成像术是确定蛋白质结构唯一可靠的手段。高度纯化的毫克数量级蛋白质,复杂的仪器分析,使得此方法费用昂贵,且耗时可达几年之久。鉴于这种情况,应用计算方法来预测蛋白质结构已成为重点研究课题。
蛋白质可分为四级结构:一级结构是指线性的氨基酸序列。共计有20种氨基酸,每个都有一个指定的大写英文字母作标识符。一个蛋白质的氨基酸序列通常被表达成这些标识符的排列序列;二级结构是指蛋白质折叠时的局部形状,有α螺旋、β折叠和反折;三级结构是蛋白质三维空间所具有的整体形状;四级结构是指当蛋白质由两个以上的多肽链组成时各链之间的关系。蛋白质的二级结构是氨基酸序列和三维构象之间的桥梁。二级结构比三级结构容易预测,又同时可作为三级结构模型构型的起点。这意味着二级结构预测对揭示氨基酸序列所蕴含的结构—功能信息极为重要。对于一级与二级结构的应象关系的描述,尚未建立一套完整的理论。二级结构预测的难点就在于此。已知的蛋白质氨基酸序列(一级结构)多达3万,仅知其中几百个蛋白质的二级结构。20世纪60年代以来发展了几十种预测方法。可分为两大类:直接方法和基于样板的方法。直接方法一般只限于某一范围内的预测。1995年有的学者用直接法完成Linus系统。该系统的计算程序基于一个分级折叠理论,只需了解氨酸序列,便能预测对应的蛋白质的二级结构。基于样板的方法近年来发展得很兴旺。学者们主要用于概率统计、神经网络等处理技术。先后用统计处理15、29、64种已知结构蛋白质,计算出各种氨基酸在α螺旋、β折叠和β反折中的实际分布与构象参数。
生物学高技术还包括细胞和原生质融合技术以及动植物细胞大规模培养技术,即细胞工程;酶及细胞固定化技术,以及酶的其他化学修饰、物理修饰、酶基因克隆、酶基因诱变技术,即酶工程;高密度发酵、连续发酵及其他新型发酵技术;现代生物反应工程、生物产品的现代分离技术;市场胚胎工程;蛋白质工程;糖工程等。
基因工程发展迅速,应用广泛而有效。用基因诊断疾病和预测人体对药物反应的技术发展迅速。血色病是美国最常见的一种遗传性疾病,患者会因血液和组织、器官中的铁含量过高而致使器官功能衰竭,导致死亡。美国国家人类基因组研究人员称,到2010年,任何人都可以通过基因检验来估计有碍健康的主要危险。美国每个基因临床检验达400万次,基因检验还能帮助了解自身对各种治疗方法的反应是怎样的。
生物学技术是在学科交叉下发展起来的,需要各方面的学者们共同努力。首先是生物学家、数学家要作出努力,尤其是数学家,因为有些难题实质上是数学问题。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。