第二节 真核生物遗传信息的表达及其调控
生物体遗传信息大多贮存于细胞染色体DNA分子中,而遗传信息的表达是通过从DNA到RNA,再到各种各样蛋白质来体现的。所谓基因表达,或称遗传信息的表达,是指将贮存于DNA中的信息转变成具体的功能RNA分子或蛋白质分子。它包括了基因转录和翻译两个层次。转录是以DNA为模板,以4种三磷酸核苷酸(NTP)为原料,依碱基配对规律,在DNA指导的RNA聚合酶催化下合成RNA的过程;翻译是将mRNA中的遗传信息转换成为蛋白质氨基酸序列的过程。大部分真核生物都是多细胞生物,在同一机体的各种细胞内含有相同的遗传信息(基因),这些基因在不同细胞中并非同时表达,而是根据机体的生长、发育、繁殖的需要,随环境的变化,有规律的选择性、程序性、适度地表达,发挥其生理功能。因此,真核生物的基因表达是在复杂的网络、严格控制下进行的。表达的失控正是许多疾病的发病原因。
一、真核生物的RNA合成
在细胞周期的某一阶段,DNA双链解开成为转录的模板,在RNA聚合酶的作用下,以4种三磷酸核苷酸为原料合成RNA链,即转录。与DNA复制相似,RNA链的延伸方向也是从5′→3′;而与DNA复制不同的是,转录仅以一条DNA链,并且是以一条DNA链的某个区段为模板合成一条RNA链。我们把该条DNA链称为模板链(template strand),与其互补的DNA链称为编码链(coding strand),把能转录产生RNA的DNA区段称为结构基因。就某一确定活化基因的转录,只能以DNA双链中的一条链为模板,这种现象称为不对称转录。真核生物的一个结构基因转录生成一条mRNA,即mRNA是单顺反子(monocistron),基本上没有原核生物的操纵元的结构。转录产生的初产物大多数无活性,需经过一定的加工后成为有活性的、成熟的RNA。目前已知的RNA包括:信使RNA(messenger RNA,mRNA)、转运RNA(transfer RNA,tRNA)、核糖体RNA(ribosomal RNA,rRNA)、核内不均一RNA(hnRNA)、小分子核内RNA(snRNA)、反义RNA(antisense RNA,asRNA)、小干扰RNA(small interference RNA,siRNA)和小/微RNA(microRNA,miRNA)。非信使RNA系的RNA又统称为非编码RNA(non-coding RNA,ncRNA)。
(一)参与转录的重要分子
1.真核细胞中的RNA聚合酶(RNA polymerase) 原核生物基因转录只用一种RNA聚合酶,它完成细胞中所有RNA的合成。真核细胞的转录机构却十分复杂。真核细胞核内存在3种RNA聚合酶,位于不同的部位,且均有复杂的亚基结构。每种酶负责不同种类基因的转录。RNA聚合酶Ⅰ合成RNA的活性最显著。它位于核仁中,负责转录编码rRNA的基因。RNA聚合酶Ⅱ位于核质中,负责核内不匀一RNA(hnRNA)的合成。hnRNA是mRNA的前体。RNA聚合酶Ⅲ负责合成tRNA和许多小的核内RNAs。转录抑制剂常用来区分这三类酶的活性。不论在何种真核细胞中,RNA聚合酶Ⅱ的活性均可迅速地被低浓度的α-鹅膏蕈碱所抑制,而RNA聚合酶Ⅰ却不被抑制。RNA聚合酶Ⅲ对α-鹅膏蕈碱的反应则不尽相同:在动物细胞中RNA聚合酶Ⅲ可被高浓度α-鹅膏蕈碱所抑制,而在酵母和昆虫细胞中则不会被抑制。
2.转录因子(transcription factors,TF) 在真核细胞中RNA聚合酶通常不能单独发挥转录作用,而需要与其他因子共同协作。将这些影响转录的因子统称为TF。TF有两大类:通用TF和基因特异TF。通用TF的作用是将RNA聚合酶与启动子结合到一起,形成转录起始复合物。基因特异性TF,亦称为反式作用因子,其作用是对特异基因的表达进行精细调控。
与RNA聚合酶Ⅰ、Ⅱ、Ⅲ相对应的TF分别称为TFⅠ、TFⅡ、TFⅢ。其中对TFⅡ研究最多。以前认为与TATA盒结合的蛋白因子是TFⅡ-D,后来发现TFⅡ-D实际上由两部分组成:①与TATA盒结合的蛋白(TATA box binding protein,TBP),能识别TATA盒,是3种RNA聚合酶转录时都需要的;②TBP相关因子(TBP associated factors,TAF),至少包括12个能与TBP紧密结合的蛋白因子。TFⅡ-H是多亚基蛋白复合体,具有依赖于ATP供给能量的DNA解旋酶活性,在转录链延伸中发挥作用;TFⅡ-E是两个亚基组成的四聚体,不直接与DNA结合,可能是与TFⅡ-B联系,能提高ATP酶的活性;TFⅡ-A能稳定TFⅡ-D与TATA盒的结合,提高转录效率。
(二)转录过程
1.起始阶段 3种RNA聚合酶的转录起始和终止各有不同。这里以RNA聚合酶Ⅱ为例说明转录的起始。转录前先是TFⅡ-D与TATA盒结合;继而TFⅡ-B以其C端与TBP-DNA复合体结合,其N端则能与RNA聚合酶Ⅱ亲和结合,接着由两个亚基组成的TFⅡ-F加入装配,TFⅡ-F能与RNA聚合酶形成复合体,还具有依赖于ATP供给能量的DNA解旋酶活性,能解开前方的DNA双螺旋,在转录链延伸中起作用。这样,启动子序列就与TFⅡ-D、B、F及RNA聚合酶Ⅱ(RNAPⅡ)结合形成一个“最低限度”能有转录功能基础的转录前起始复合物(pre-intitiation complex,PIC),能开始转录mRNA。
以上所述是典型的启动子上转录复合体的形成过程,但有的真核启动子不含TATA盒或不通过TATA盒开始转录。例如有的无TATA盒的启动子是靠TFⅡ-I和TFⅡ-D共同组成稳定的转录起始复合体开始转录的。由此可见真核转录起始的复杂性。
2.延伸和终止阶段 真核生物基因转录延伸的机制与原核生物基本一致,按碱基配对原则,从5′→3′方向逐个加入核糖核苷酸合成RNA链。所不同的是真核生物的DNA是与组蛋白结合形成核小体而存在的,当基因被激活时,该基因调控区的核小体不存在,组蛋白暂被推开。当RNA聚合酶通过结构基因进行转录时,下游的DNA解开对核心组蛋白的缠绕,被移位到RNA聚合酶的后面,然后重新与同一DNA分子结合。RNA聚合酶则在这些处于解缠绕和重新缠绕之间的DNA环上移动和转录。
RNA聚合酶Ⅱ基因的转录终止研究的较少,所了解的基本特征是:①基因的3′端具有指令转录终止的信号,其组成依基因种类不同而异;②3′端有一段保守的序列,涉及RNA前体3′端切除和加尾的信号(AATAAA);③转录终止与转录物的3′端加工是2个独立的事件,依赖于不同的机制。
(三)RNA的加工和成熟
不论原核或真核生物的rRNAs和tRNAs都是以更为复杂的初级转录本形式被合成的,然后才能加工成为成熟的RNA分子。然而绝大多数原核生物的mRNA却不需加工,仍为初级转录本的形式。相反,真核生物从断裂基因产生的mRNA前体要经过复杂的加工历程。RNA聚合酶Ⅱ基因的转录在细胞核内进行,由基因编码区转录的初产物称为核非均一RNA(hnRNA)。hnRNA的寿命短(5~15分钟),由hnRNA转变为成熟的mRNA必须经过一系列的加工,包括5′端加帽修饰、3′端加尾和去除内含子的剪接。并且,mRNA前体的加工与转录过程是相偶联的。
mRNA 5′端加帽是一个多步加工过程,当mRNA前体从RNA聚合酶Ⅱ中露出其5′端时即已开始。第一步是将一个鸟苷酸加在5′RNA的前端,第二步反应是将一个甲基加到嘌呤环的7位氮原子,形成O型帽子结构,即m7GpppN。在不同真核生物的mRNA,5′端帽亦不同。帽子可分为3种不同的类型,即O型、Ⅰ型和Ⅱ型。O型为m7GpppN,即碱基鸟嘌呤第7位被甲基化;Ⅰ型为m7GpppN1mp,即转录出的mRNA的第一位核苷的核糖2′位也被甲基化(C2甲基化);Ⅱ型为m7GpppN1mpN2mp,即mRNA的第一个核苷和第二个核苷的核糖2′位均被甲基化。帽子结构中m7Gppp与下一个核苷酸连接是以5′与5′相连的方式(G5′ppp5′N),这和一般的多核苷酸中的5′与3′连接方式不同,这种特殊的连接方式称为相对核苷酸结构。
5′端帽子至少有两种功能。一是对翻译起识别作用;二是稳定mRNA的作用。mRNA的帽结构可保护mRNA 5′端避免外切核酸酶的攻击。在体外无细胞翻译系统中证明,有帽的反转录病毒mRNA较无帽的反转录病毒mRNA更稳定。帽结构的G不甲基化时翻译效果减弱,但稳定性不变。此外,帽子结构可能作为mRNA进出细胞核的识别标记。
已经证明mRNA确实是从hnRNA生成的。在切除内含子之前,hnRNA可先加帽和加poly(A)尾链。有一种称为poly(A)聚合酶的酶可以用ATP为底物,将hnRNA加上50~200个腺苷酸残基,构成poly(A)尾链,这是hnRNA转变为成熟的mRNA所必需的。可能多聚腺苷酸化是hnRNA分子要被加工的信号。在哺乳动物细胞中,mRNA中约70%带有poly(A)尾。一般认为mRNA的3′端有着非常保守的AAUAAA加尾信号。Poly(A)尾结构的生物学功能还不太清楚,初步认为与hnRNA从核内移出和抵抗外切核酸酶从3′端降解mRNA有关。
细胞质内的mRNA平均只有1800~2000个碱基。而哺乳动物的hnRNA范围很广泛,从2000~14000个碱基均有,平均有8000~10000个碱基,所以一般要比mRNA大4~5倍。如果以5倍计算,由于正常哺乳动物细胞中测得mRNA仅占hnRNA量的5%,则相当于有25%的hnRNA可转变为mRNA。这意味着有3/4的hnRNA在核内降解。hnRNA被切除内含子后即成为mRNA,并进入细胞质内。在内含子左侧的连接点称为供体,在内含子右侧的称为受体。内含子都是以GU开始,以AG结束。内含子的剪接是以套索形式,通过两次转酯作用完成的。在mRNA前体剪接过程中至少有5种细胞核小RNA参与(U1、U2、U4、U5和U6snRNA)。真核细胞的细胞核和细胞质中都含有许多小RNA,它们有100~300个碱基,每个细胞中可含有105~106个这种RNA分子。它们是由RNA聚合酶Ⅱ或Ⅲ所合成的,其中的一些也像mRNA一样可被加帽。在细胞核中的小RNA称为snRNA,而在细胞质中的称为scRNA。
二、蛋白质的生物合成
真核细胞的蛋白质生物合成过程基本类似于原核细胞的蛋白质生物合成过程,也是在核糖体上进行,以mRNA为密码逐个从N端合成氨基酸多肽链,不过目前的研究表明遗传密码也不是完全不变的,存在着可选择性。真核细胞与原核细胞的蛋白质生物合成差别除参与蛋白质生物合成的核糖体结构、大小及组成和mRNA的结构等不同外,主要区别在真核细胞蛋白质生物合成的起始步骤。这一步骤涉及的起始因子(eucaryotic initiation factor,eIF)至少达9种,而且许多起始因子本身是多亚基的蛋白质。因此起始过程更为复杂些。蛋白质生物合成可分为5个阶段:氨基酸的活化、多肽链合成的起始、肽链的延长、肽链的终止和释放、蛋白质合成后的加工修饰。
(一)氨基酰-tRNA的生成
氨基酸在进行合成多肽链之前,必须先经过活化,然后再与其特异的tRNA结合,带到mRNA相应的位置上,这个过程靠氨基酰tRNA合酶催化,此酶催化特定的氨基酸与特异的tRNA相结合,生成各种氨基酰tRNA。原核细胞中起始氨基酸活化后,还要甲酰化,形成甲酰蛋氨酸tRNA,由N10甲酰四氢叶酸提供甲酰基。而真核细胞没有此过程。
(二)多肽链合成的起始
核蛋白体大小亚基、mRNA、起始tRNA和起始因子共同参与肽链合成的起始。真核细胞蛋白质生物合成的起始步骤可概括为:①需要特异的起始tRNA,并且不需要N端甲酰化。已发现的真核起始因子(eukaryote initiation factor,eIF)有10多种;②起始复合物形成在mRNA 5′端AUG上游的帽子结构(某些病毒mRNA除外);③ATP水解为ADP供给mRNA结合所需要的能量。
真核细胞起始复合物的形成过程是:翻译起始也是由eIF-3结合在40S小亚基上而促进80S核糖体解离出60S大亚基开始,同时eIF-2在辅eIF-2作用下,与Met-tRNAfmet及GTP结合,再通过eIF-3及eIF-4C的作用,先结合到40S小亚基,然后再与mRNA结合。
mRNA结合到40S小亚基时,除了eIF-3参加外,还需要eIF-1、eIF-4A及eIF-4B,并由ATP水解为ADP及Pi来供能,通过帽结合因子与mRNA的帽结合而转移到小亚基上。但是在mRNA 5′端并未发现能与小亚基18SRNA配对的S-D序列。目前认为通过帽结合后,mRNA在小亚基上向下游移动而进行扫描,可使mRNA上的起始密码AUG在Met-tRNAfmet的反密码位置固定下来,进行翻译起始。
通过eIF-5的作用,可使Met-tRNAfmet·GTP及mRNAR40S小亚基与60S大亚基结合,形成80S复合物。EIF-5具有GTPase活性,催化GTP水解为GDP及Pi,并有利于其他起始因子从40S小亚基表面脱落,从而有利于40S与60S两个亚基结合起来,最后经eIF-4D激活而成为具有活性的80SMet-tRNAfmet·mRNA起始复合物。
在真核生物蛋白质生物合成的起始阶段,值得一提的是40S核糖体亚基几乎总是选择第一个起始密码子AUG,开始对mRNA翻译,这种选择比原核细胞对起始密码子的选择方式更简单些。
(三)多肽链的延长和终止
在多肽链上每增加一个氨基酸都需要经过进位、转肽和移位3个步骤。与真核细胞蛋白质生物合成的起始因子相比较,在延长和终止步骤中所涉及的因子就十分简单。目前已知的与真核生物肽链延长和终止相关的因子有4种。延长因子(EF)α,相对分子质量约50000。EF1α可与GTP和aa-tRNA形成复合物,并把aa-tRNA供给核糖体。对EF1βγ的研究不像对原核细胞EF-Ts那么清楚,但已证明EF1βγ能催化GDP-GTP交换,有助于EF1α再循环利用,EF2相对分子质量约100000,相当于原核细胞的EF-G,催化GTP水解和使aa-tRNA从A位转移至P位。肽链合成的终止仅涉及一种释放因子(RF),相对分子质量约115000。它可以识别所有的3种终止密码子UAA、UAG和UGA。RF在活化了肽酰转移酶释放新生的肽链后,即从核糖体解离,解离过程涉及GTP水解,故终止肽链合成是耗能的。
(四)核糖体循环和多核糖体翻译
核糖体在肽链释放因子的作用下,解离出大、小亚基。解离后的大、小亚基又重新参加新的肽链的合成,循环往复,所以多肽链在核糖体上的合成过程又称核糖体循环。
上述只是单个核糖体的翻译过程,事实上在细胞内一条mRNA链上结合着多个核糖体,甚至可多到几百个。蛋白质开始合成时,第1个核糖体在mRNA的起始部位结合,引入第1个甲硫(蛋)氨酸,然后核糖体向mRNA的3′端移动一定距离后。第2个核糖体又在mRNA的起始部位结合,再向前移动一定的距离后,又结合上第3个核糖体,依次下去,直至终止。两个核糖体之间有一定的长度间隔,每个核糖体都独立完成一条多肽链的合成,所以这种多核糖体可以在一条mRNA链上同时合成多条相同的多肽链,这就大大提高了翻译的效率(图2-8)。
图2-8 多核糖体翻译
多聚核糖体的核糖体个数,与模板mRNA的长度有关,例如血红蛋白的多肽链mNRA编码区有450个核苷酸组成,长约150nm。上面串有5~6个核糖核蛋白体形成多核糖体。而肌凝蛋白的重链mRNA由5400个核苷酸组成,它由60多个核糖体构成多核糖体完成多肽链的合成。
(五)蛋白质合成后的分泌
蛋白质合成的部位在核糖体,合成后有的保留在胞质,有的进入细胞核、线粒体或其他细胞器,也有的分泌至体液,然后输送至靶器官或靶细胞。蛋白质合成后,定向地到达其执行功能的目标地点,称为靶向输送。穿过合成所在的细胞到其他组织细胞去的蛋白质,可统称为分泌性蛋白质。分泌性蛋白质的末端多出一段疏水氨基酸较多的肽段,这段肽链称为信号肽。它具有被细胞转运系统识别的特征性氨基酸序列,其作用是把合成的蛋白质移向胞膜,然后把蛋白质送出胞外。信号肽一般由10~40多个氨基酸残基组成,并大致分为3个区段:N端为带正电荷的碱性氨基末端,中间是以中性氨基酸为主组成的疏水核心区,C端是被信号肽酶裂解的部位。蛋白质合成后透过膜性结构必须具备3个条件:信号肽、蛋白质自身的结构特点和转运的机构。
在20世纪80年代初期,Walter等人已提出了肯定的证据表明:在启动分泌和控制分泌方面,有一个RNA-蛋白质复合物起关键作用。由于该复合物能与新生的信号肽特异性结合,故被命名为信号识别颗粒(signal recognition particle,SRP)。SRP由一个7SRNA和6种不同的蛋白质紧密结合组成。SRP的作用是能与核糖体结合并停止蛋白质合成,与信号肽共同作用,使得这些分泌蛋白能及时进入膜性腔内,完成转运和分泌。
(六)肽链的翻译后加工
从核糖体上最终释出的多肽链,即使能自行卷曲而具有一定的构象,但还不是具有生物活性的成熟蛋白质,必须进一步加工,进行折叠、切割和修饰,乃至聚合才能表现出生理活性。这些蛋白质的修饰过程,称为翻译后加工。
1.新生肽链的折叠 新合成的多肽链经过折叠形成一定的空间结构才能有生物学活性。肽链的折叠是在折叠酶或分子伴侣参与下完成的。折叠酶包括蛋白二硫键异构酶和脯氨酰顺反异构酶。分子伴侣广泛存在于原核和真核细胞中,是一个结构上互不相同的蛋白质家族,它们能识别肽链的非天然构象,促进蛋白质正确折叠。近来研究最多的分子伴侣是热休克蛋白(heat shock protein,Hsp)70和60。
2.共价修饰
(1)糖苷化:对于膜蛋白,常常要通过粗面内质网上糖苷转移酶,在膜脂磷酸长萜醇的介导下进行糖基化。蛋白质糖基化可以按照氨基酸和糖的连接方式分为4种类型:O位糖基化、N位糖基化、C位甘露糖以及GPI(glycophosphatidlyinositol)锚定连接。
(2)脂化:酰基转移酶可以催化脂肪酸与肽链中的半胱氨酸巯基以硫酯键结合,形成脂化蛋白。脂质共价修饰能影响蛋白质的生物功能,例如改善蛋白质的膜结合能力和(或)蛋白质-蛋白质相互作用等。
(3)磷酸化、甲基化、乙酰化、羟基化、碘化、ADP-核苷化和泛素化:蛋白质中的一些氨基酸如羟脯氨酸、羟赖氨酸,都是在肽链合成后由相应氨基酸侧链羟化修饰形成的。另外氨基酸的共价修饰包括磷酸化、甲基化、乙酰化等,均会改变氨基酸的性质和功能。例如不少酶的活性中心上有磷酸化的丝氨酸、苏氨酸,甚至酪氨酸;这些含羟基的氨基酸是翻译后才磷酸化的。磷酸化涉及细胞信号转导、神经活动、肌肉收缩以及细胞的增殖、发育和分化等生理病理过程;组蛋白上的甲基化和乙酰化与转录调节有关;而泛素化对于细胞分化、细胞器的生物合成、细胞凋亡、DNA修复、新蛋白生成、调控细胞增殖、蛋白质输运、免疫应答和应激反应等生理过程都起到很重要的作用。
3.水解去除信号肽和部分肽段 人们发现,将某些分泌蛋白质mRNA在体外进行翻译时,其翻译产物的相对分子质量比预计的要大得多。例如胰岛素由51个氨酸残基组成,但胰岛素mRNA的翻译产物在兔网织红细胞无细胞翻译体系中为86个氨基酸残基,称为胰岛素原。后来证明,在前胰岛素原的M-末端有一段富含疏水氨基酸的肽段作为信号肽。现发现,几乎各种分泌蛋白质(如真核细胞的前清蛋白、免疫球蛋白轻链和泌乳素等)均含有信号肽。信号肽在完成定向输送功能后,随即被一种特异的信号肽酶水解。
另外有许多酶类翻译的初产物没有活性称为酶原,在切除部分肽段后,才最终形成有活性的酶。一般真核细胞中一个基因对应一个mRNA,一个mRNA对应一条多肽链,但也有少数例外情况,即一种翻译后的多肽链经水解后产生几种不同的蛋白质或多肽。例如哺乳动物的阿片样促黑素促皮质激素原(POMC)由265个氨基酸残基构成,经水解后可产生多个活性肽:β-内啡肽、β-促黑激素和γ-促黑激素、促肾上贤皮质及β-脂肪酸释放激素等。
4.亚单位聚合 有许多蛋白质是由两个以上亚基构成的,这就需这些多肽链通过非共价键聚合成多聚体才能表现生物活性。例如成人血红蛋白由两条α、β链及4分子血红素所组成,大致聚合过程如下:α链在多聚核糖体合成后自行释下,并与尚未从多聚核糖体上释下的β链相连,然后一并从多聚核糖体上脱下来,变成α、β-二聚体。此二聚体再与线粒体内生成的两个血红素结合,最后形成一个由4条肽链和4个血红素构成的有功能的血红蛋白分子。
三、真核基因表达调控
真核基因组比原核基因组大得多,大肠埃希菌基因组约4×106bp,哺乳类基因组在109bp数量级,比细菌大千倍。真核生物主要的遗传物质与组蛋白等构成染色质,被包裹在核膜内,核外还有遗传成分(如线粒体DNA等)。此外,真核细胞的许多活性蛋白是由相同和不同的多肽链形成的亚基构成的,涉及多个基因协调表达的问题,这就增加了基因表达调控的层次和复杂性。因此,真核生物基因协调表达要比原核生物复杂得多。真核生物基因表达的调控在DNA水平、转录水平、转录后水平、翻译水平和翻译后水平各个层次展开,其中最主要的调控仍然在转录水平上。
(一)基因表达调控的一些基本概念
真核生物基因表达的特点是细胞的全能性和基因表达的时空性。全能性是指同一种生物的所有细胞都含有相同的DNA,即基因的种类和数目是一样的,它们都有发育成完整个体的潜能。但在个体的不同发育阶段和不同的组织中,细胞内各种蛋白质的组成是不同的,即基因的表达的种类和数目是不同的。可见基因的表达具有时间性和组织特异性,即时空性。其中一些基因的表达产物在生命过程的整个阶段都是必不可少的,这些基因在一个生物体的几乎所有细胞中持续表达,被称为管家基因。管家基因的表达较少受环境因素的影响,在个体各个生长阶段的几乎全部组织中持续表达或变化很小,这类基因的表达方式称为组成性基因表达(constitutive gene expression)。另外一些基因的表达易受环境因素的影响,在特定条件的刺激下,它们的表达增强或开放,称为诱导表达(induction expression)。相反,有些基因的表达在环境因素的影响下表现为下降或关闭,被称为阻遏表达(repression expression)。此外,在生物体内,各种代谢途径要在许多不同酶类的共同参与下完成,为了这些代谢能够有条不紊地进行,功能相关的一组基因就得协调一致、共同表达,称为协调表达(coordinance expression)。为适应机体生长、发育、繁殖的需要以及适应环境,含有相同遗传信息的各种细胞的基因就必须有规律的选择性、程序性和适度地表达,这种基因表达是通过基因表达的调节和控制来实现的。
(二)DNA水平的调控
真核生物基因表达在DNA水平的调控主要通过下列几种方式。
1.基因重排 即胚原性基因组中某些基因会再组合变化形成第二级基因。例如编码完整抗体蛋白的基因是在淋巴细胞分化发育过程中,由原来分开的几百个不同的可变区基因经选择、组合、变化,与恒定区基因一起构成稳定的、为特定的完整抗体蛋白编码的可表达的基因。这种基因重排使细胞可能利用几百个抗体基因的片段,组合变化而产生能编码达108种不同抗体的基因,其中就有复杂的基因表达调控机制。
2.基因扩增和基因丢失 基因扩增即基因组中的特定段落在某些情况下会复制产生许多拷贝。最早发现的是蛙的成熟卵细胞于受精后的发育过程中其rRNA基因(可称为rDNA)可扩增2000倍。以后发现其他动物的卵细胞也有同样的情况,这很显然适合了受精后迅速发育分裂要合成大量蛋白质,需要有大量核糖体的存在。又如甲氨蝶呤(methotrexate,MTX)是叶酸的结构类似物,可诱导利用叶酸所必需的二氢叶酸还原酶(dihydrofolate reductase,DHFR)基因的DNA区段扩增多倍,使DHFR的表达量显著增加,从而提高对MTX的抗性。基因的扩增无疑能够大幅度提高基因表达产物的量,但这种调控机制至今还不清楚。另一方面一些生物如高等动物红细胞在发育成熟过程中却有部分染色质的丢失,是不可逆的调控。
3.真核基因的转录与染色质的结构变化相关 真核基因组DNA绝大部分都在细胞核内与组蛋白等结合成染色质,染色质的结构、染色质中DNA和组蛋白的结构状态都影响转录,尤其是转录的起始,因此也可将染色质的结构的调节归到转录水平调控,有以下几种现象。
(1)染色质结构影响基因转录:细胞分裂时染色体的大部分到间期时松开分散在核内,称为常染色质(euchromatin),松散的染色质中的基因可以转录。染色体中的某些区段到分裂期后不像其他部分解旋松开,仍保持紧凑折叠的结构,在间期核中可以看到其浓集的斑块称为异染色质(heterochromatin),其中从未见有基因转录表达。原本在常染色质中表达的基因如移到异染色质内也会停止表达;哺乳类雌体细胞2条X染色体,到间期一条变成异染色质者,这条X染色体上的基因就全部失活。可见紧密的染色质结构阻止基因表达。
(2)DNA拓扑结构变化:天然双链DNA的构象大多是负性超螺旋。当基因活跃转录时,RNA聚合酶转录方向前方DNA的构象是正性超螺旋,其后面的DNA为负性超螺旋。正性超螺旋会拆散核小体,有利于RNA聚合酶向前移动转录;而负性超螺旋则有利于核小体的再形成。
(3)DNA碱基修饰:真核DNA中的胞嘧啶约有5%被甲基化为5-甲基胞嘧啶(5-ethylcytidine,m5C),而活跃转录的DNA段落中胞嘧啶甲基化程度常较低。这种甲基化最常发生在某些基因5′侧区的CpG序列中,实验表明这段序列甲基化可使其后的基因不能转录,甲基化可能阻碍转录因子与DNA特定部位的结合从而影响转录。如果用基因打靶的方法除去主要的DNA甲基化酶,小鼠的胚胎就不能正常发育而死亡,可见DNA的甲基化对基因表达调控是重要的。而DNA去甲基化常与DNaseⅠ高敏感点同时出现,高敏感点常出现在调控蛋白结合位点的附近,可能有利于调控蛋白结合而促进转录。
(4)组蛋白的作用:现已发现组蛋白有许多类型翻译后共价修饰,包括乙酰化、磷酸化、甲基化、泛素化、生物素化、ADP-核苷化和SUMO化等。因此,组蛋白不仅包装DNA成为核小体,其末端的各种共价修饰还构成了独特的“组蛋白密码(histone code)”,可以被一系列特定蛋白质或蛋白质复合物所识别,从而将这种密码翻译成特定的染色质状态,调节基因表达。DNA碱基和组蛋白修饰又称为表观遗传修饰,研究这些修饰与基因表达的关系,称为表观遗传调控(epigenetic regulation)。
(三)真核基因转录水平的调控
真核细胞的3种RNA聚合酶(Ⅰ、Ⅱ和Ⅲ)中,只有RNA聚合酶Ⅱ能转录生成mRNA,以下主要讨论RNA聚合酶Ⅱ的转录调控。
1.顺式作用元件(cis-acting elements) 真核基因的顺式调控元件是基因周围能与特异转录因子结合而影响转录的DNA序列。其中主要是起正性调控作用的顺式作用元件,包括启动子(promoter)、增强子(enhancer);近年又发现起负性调控作用的元件称为沉默(寂)子(silencer)。
(1)启动子:是指RNA聚合酶所结合并启动转录的DNA序列。真核启动子一般包括转录起始点及其上游100~200bp序列,包含有若干具有独立功能的DNA序列元件,每个元件长7~30bp。启动子中的元件可以分为两种:①核心启动子元件:指RNA聚合酶起始转录所必需的最小的DNA序列,包括转录起始点及其上游-25/-30bp处的TATA盒。核心元件单独起作用时只能确定转录起始位点和产生基础水平的转录。②上游启动子元件:包括通常位于-70bp附近的CAAT盒和GC盒,以及距转录起始点更远的上游元件。这些元件与相应的蛋白因子结合能提高或改变转录效率。不同基因具有不同的上游启动子元件,其位置也不相同,这使得不同的基因表达分别有不同的调控。
(2)增强子:是一种能够提高转录效率的顺式调控元件,通常占100~200bp长度,也和启动子一样由若干组件构成,基本核心组件常为8~12bp,可以单拷贝或多拷贝串联形式存在。增强子的作用有以下特点:①增强子提高同一条DNA链上基因转录效率,可以远距离作用,而且在基因的上游或下游都能起作用。②增强子作用与其序列的正反方向无关,将增强子方向倒置依然能起作用。而将启动子倒置就不能起作用,可见增强子与启动子是很不相同的。③增强子要有启动子才能发挥作用,没有启动子存在,增强子不能表现活性。但增强子对启动子没有严格的专一性,同一增强子可以影响不同类型启动子的转录。例如当含有增强子的病毒基因组整合入宿主细胞基因组时,能够增强整合区附近宿主某些基因的转录。当增强子随某些染色体段落移位时,也能提高移到的新位置周围基因的转录。使某些癌基因转录表达增强,可能是肿瘤发生的因素之一。④增强子的作用机制虽然还不明确,但与其他顺式调控元件一样,必须与特定的蛋白质因子结合后才能发挥增强转录的作用。增强子一般具有组织或细胞特异性,许多增强子只在某些细胞或组织中表现活性,是由这些细胞或组织中具有的特异性蛋白质因子所决定的。
(3)沉默子:为负调控顺式元件,在基因转录降低或关闭中起作用,沉默子的作用可不受序列方向的影响,也能远距离发挥作用,并可对异源基因的表达起作用。
2.反式作用因子(trans-acting factors) 在真核细胞内存在着一类直接或间接与上述DNA顺式作用元件特异性结合的蛋白质因子,被称为反式作用因子,又称为真核转录因子。目前,所知的反式作用因子有:RNA聚合酶、普通转录因子、转录激活因子和转录抑制因子,其中转录激活因子和转录抑制因子为基因特异性转录因子,一般来说反式作用因子多指基因特异性转录因子。不同基因由不同的上游启动子元件组成,能与不同的反式作用因子结合,这些反式作用因子通过与基础的转录复合体的相互作用来影响转录的效率。
作为蛋白质的转录因子从功能上分析其结构可包含有不同区域:①DNA结合域:多由60~100个氨基酸残基组成的几个亚区组成;②转录激活域:常由30~100个氨基酸残基组成,这结构域有富含酸性氨基酸、富含谷氨酰胺和富含脯氨酸等不同种类,一般酸性结构域最多见;③连接区:即连接两个及以上结构域的部分。不与DNA直接结合的转录因子没有DNA结合域,但能通过转录激活域直接或间接地与转录复合体作用而影响转录效率。
(四)转录后水平的调控
真核生物基因转录的原始产物是没有活性的,称为初级转录产物。初级转录产物必须经过一定的加工和修饰并输出到胞质内才能发挥作用,在这些过程中,可以对基因的表达进行调控。通常转录后水平的调控是指对mRNA的加工、成熟、运输及其稳定性的调控。mRNA的加帽和加尾已在以上转录过程中叙述,它们的主要作用是保护mRNA,是维持mRNA稳定性的重要因素,同时在翻译水平上起重要调控作用,将在翻译水平上进行论述。在此仅介绍剪接、编辑和运输。
1.选择剪接(alternative splicing) 在转录后水平调控上起重要作用的另一mRNA加工是剪接。真核生物基因是断裂基因,其转录初产物中含有内含子,经加工将内含子除去,再把外显子连接起来才能生成成熟的mRNA。在剪接的过程中,参加拼接的外显子可以不按它们在基因组的线性分布次序拼接,内含子也可以不被切除而保留,即一个外显子或内含子是否出现在成熟的mRNA中是可以选择的,这种剪接方式称为选择剪接。现已发现的选择剪接有:①外显子选择:即在mRNA成熟的过程中,外显子可以全部保留,也可以删除一个或几个;②内含子选择:即内含子可以全部删除或保留某一个;③互斥外显子:即两个外显子不能同时出现在同一个成熟的mRNA中;④内部剪接,即保留全部外显子或剪切掉某外显子的部分序列;或去掉全部内含子或保留某一内含子的一部分序列。
2.反式剪接(trans-splicing) 通常所说的剪接是指顺式剪接(cis-splicing),即剪接在同一条mRNA前体链上进行。除此以外,真核生物细胞内还有另一种剪接方式,即将来自不同基因,甚至是来自不同染色体的外显子通过剪接,生成在同一条成熟的mRNA分子上,这种剪接方式称为反式剪接。反式剪接克服了基因所携带信息量的限制,提高了遗传信息的使用效率,也成为基因表达调控的重要机制之一。
3.RNA编辑 mRNA在转录后的成熟过程中,可以插入、缺失或替换一些核苷酸,从而改变阅读框和编码信息,这一现象称为RNA编辑,mRNA编辑主要是指在RNA分子上加U或减U。加减U的量可达mRNA碱基总量的60%。RNA编辑的结果不仅可以扩大遗传信息的储存量,而且也是生物适应环境的一种保护措施。
4.mRNA的运输 mRNA在细胞核内成熟后要运输到细胞质中才能作为翻译的模板。实验证明,大约有20%的mRNA进入胞质,留在核内的RNA约在1小时内降解成小片段。mRNA的运输过程是个主动过程。因此,通过控制mRNA是否向胞质运输,也可以对基因表达进行调控。
(五)翻译和翻译后水平的调控
1.mRNA稳定性调节 mRNA进入胞质后,作为直接模板指导蛋白质的合成,mRNA量的多少会直接影响到翻译的水平。因此,mRNA的稳定性是翻译水平调控的一个重要因素。在真核细胞中,mRNA的稳定性差别很大,有的半衰期<30分钟,有的半衰期>10小时。mRNA 3′端非编码区结构影响其稳定性,如组蛋白mRNA 3′端非编码区有特殊的茎-环结构,其稳定性受到DNA合成的调节。在DNA合成时,组蛋白mRNA的半衰期约1小时,在没有DNA合成时,其半衰期只有12分钟左右。
最近发现,mRNA的寿命受到小RNA(microRNAs或miRNAs)的影响,小RNA是一种类似于小干扰RNA(siRNA)的分子,由高等真核生物基因组编码,小RNA通过和靶基因mRNA碱基配对来引导沉默复合体(RISC)降解mRNA或阻碍其翻译。一个miRNA可以有多个靶基因,而几个miRNAs也可以调节同一个基因。这种复杂的调节网络既可以通过一个miRNA来调控多个基因的表达,也可以通过几个miRNAs的组合来精细调控某个基因的表达。miRNAs在物种进化中相当保守,在植物、动物和真菌中发现的miRNAs只在特定的组织和发育阶段表达。miRNA的组织特异性和时序性决定了组织和细胞的功能特异性,表明其在细胞生长和发育过程的调节过程中起多种作用。随着miRNA调控基因表达的研究的逐步深入,将帮助我们理解高等真核生物的基因组的复杂性和复杂的基因表达调控网络。
2.翻译起始调控 真核细胞翻译起始阶段需要10余种起始因子的参与,这些因子的活性调节正是翻译水平调控的重要部分,尤其是在翻译的起始阶段,80SMet-tRNAi-mRNA起始复合物形成之前的各个阶段都可以发生调控作用。翻译起始因子如eIF-4F的活性是通过磷酸化来调节的,当eIF-4F被磷酸化时,蛋白质合成增加,eIF-4F去磷酸化后,蛋白质合成速率减低。同样eIF-2的去磷酸化使eIF-2-GTP-Met-tRNAi复合物形成受阻,蛋白质合成起始复合物不能形成,翻译过程受到抑制。这些起始蛋白的磷酸化又是由蛋白激酶所催化,而蛋白激酶的活性也是受到系列调控,因此翻译起始的调节也是十分复杂的。
3.mRNA二级结构的影响 mRNA分子的空间结构与其翻译速率的调控有密切关系,其中最典型的例子是铁蛋白的合成。铁蛋白mRNA的5′端非翻译区存在铁反应元件(iron response element,IRE),IRE内部互补可形成局部二级结构,并与IRE结合蛋白结合,抑制了铁蛋白合成。当细胞中铁离子浓度增加时,Fe3+与IRE结合蛋白相互作用,从而减低了IRE结合蛋白对IRE的亲和力,解除了对翻译的抑制作用,铁蛋白合成增加。
4.反义RNA(antisense RNA,asRNA)的调控 asRNA是指能与细胞内DNA或RNA互补结合的一段RNA片段,若asRNA通过碱基的互补配对与mRNA分子的5′端碱基结合,就影响到翻译起始复合物的形成,从而抑制翻译。asRNA原在原核生物中发现,具有抑制翻译和转录的作用。最近在真核生物普通酿酒酵母中也发现一种IME4基因的asRNA能与其正义RNA结合,阻断正义RNA翻译蛋白质的能力。这种正义/反义的举动,是一种调节阴和阳效果平衡的方法。asRNA和miRNA的调控是通过核酸与核酸的相互作用来实现的,这突破了以往普遍认为的基因表达调控是通过蛋白质与核酸相互作用来实现的传统观念。
5.翻译后水平的调控 新合成蛋白质半衰期的长短,也是决定蛋白质总的生物功能强弱、持续时间长短的重要影响因素。因此对新生肽的水解也是基因表达调控的一个重要环节。而蛋白质的共价修饰如磷酸化、糖基化、乙酰化、甲基化和泛素化等对调节蛋白质的活性有重要作用。
从上述可见:基因表达调控的实质在于核酸与核酸、蛋白质与DNA、蛋白质与RNA、蛋白质与蛋白质之间的相互作用,构象的变化正是蛋白质和核酸“活”的表现。而参与转录、翻译的各种因子的活性还受到多种机制的调节,包括磷酸化-去磷酸化、糖基化、蛋白质与蛋白质之间的相互作用等。因此,基因表达调控是个十分复杂的网络。对生物大分子间的辨认、相互作用、结构上的变化及其在生命活动中的意义,人们的认识和研究还只在起步阶段,其中许多内容甚至重要的规律可能至今还一无所知,有待于努力探索。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。