真核生物基因转录的直接产物一般是无功能的,称为初级转录产物(primary transcripts),需在细胞核内进行加工修饰,成为成熟的RNA,具有活性,才能发挥各自的功能。真核生物的转录后加工修饰远比原核生物复杂,不同RNA的加工方式不同。
(一)mRNA前体的转录后加工
真核生物mRNA的初级转录产物是hnRNA,称为杂化核RNA(hetero-nuclear RNA,hnRNA),mRNA的加工包括5′端加帽、3′端加poly(A)尾、剪接(splicing)以及编辑(eduting)等。
1.5′端帽子结构的形成(图5-4) mRNA前体的5′端为pppNp-,RNA链开始合成后不久,经磷酸酶催化水解,释放出Pi,5′端成为ppNp-;在鸟苷酸转移酶催化下,与一分子三磷酸鸟苷酸反应,末端成为GpppNp-,加上去的鸟苷酸与原5′末端的核苷酸不是以3′,5′-磷酸二酯键连接,而是通过5′磷酸基团相连,因此,加帽后的5′端仍具有3′-OH和2′-OH。mRNA前体的5′端加上鸟苷酸后,在甲基转移酶催化下,由S-腺苷甲硫氨酸(SAM)供给甲基,在鸟嘌呤的N-7上甲基化,成为m7 GpppNp-,这就是mRNA5′末端的帽子结构,称为帽子0型结构。
图5-4 真核细胞mRNA的加帽反应
连于鸟苷酸的第一个或第二个核苷酸的2′-OH也可以被甲基化,连于鸟苷酸的第一个核苷酸2′-OH被甲基化,称为Ⅰ型帽子结构,若第一个核苷酸和第二个核苷酸的2′-OH都被甲基化,则称为Ⅱ型帽子结构。
2.3′端多聚腺苷酸的加入(图5-5) mRNA3′端的多聚腺苷酸(poly A)尾巴是转录后加上去的,在模板链上没有相应的polyT序列。mRNA3′端加poly(A)尾的反应是在细胞核内完成的。在结构基因最后一个外显子的3′端,常有一组共同序列AATAAA,其下游还有相当多的GT序列,这些序列称为转录终止的修饰点。当转录中的mRNA前体出现加尾信号(AAUAAA及其下游的GU丰富区或U丰富区)时,即可被几个蛋白因子识别并结合。
哺乳动物mRNA在加尾信号部位的断裂需要几个蛋白质的作用。
(1)断裂与多聚腺苷酸化特异性因子(cleavage and polyadenylation specificity factor,CPSF),为加poly(A)尾所必需的蛋白,CPSF的作用是识别并结合AAUAAA信号。
(2)断裂刺激因子(cleavage stimulation factor,CstF),也参加识别多聚腺苷酸化位点,CstF结合于GU丰富区。CPSF和CstF结合于mRNA的断裂和多聚腺苷酸化位点的两侧,两个因子单独与mRNA结合都是不稳定的,同时结合则可协同作用,形成稳定的复合物。
图5-5 真核细胞mRNA加尾反应模式
(3)断裂因子Ⅰ和Ⅱ(cleavage factorⅠ,CFⅠ和cleavage factorⅡ,CFⅡ),为特殊的内切核酸酶,负责剪切反应。
(4)poly(A)聚合酶也可能参与mRNA断裂过程,因为mRNA一断裂,加A的反应就立即开始,没有时间间隔。
当上述几种因子结合于mRNA后,即可在AAUAAA下游10~30个核苷酸处将mRNA切断,poly(A)聚合酶随即以ATP为底物,在mRNA的3′末端催化合成poly(A)。加A过程分为两个阶段,第一阶段是起始阶段,在mRNA3′端缓慢加上至少10个A,此阶段依赖于AAUAAA和CPSF;第二阶段是延长阶段,不依赖AAUAAA,而是依赖于第一阶段加的oligo(A),当oligo(A)形成后,poly(A)-结合蛋白Ⅱ[poly(A)-binding proteinⅡ,PABPⅡ]与之结合,促进poly(A)聚合酶的加A反应,第二阶段的反应很快,在mRNA的3′末端加上200多个A。
一般真核生物在胞质中出现的mRNA的poly(A)长度在100~200个核苷酸之间。也有少数例外,如组蛋白基因的转录产物,无论是初级的或成熟的都没有poly(A)尾。
3.mRNA前体的剪接 1977年,Philip Sharp和Richard Roberts在研究腺病毒基因时发现表达蛋白质出现断裂现象,即基因中间被一些不能表达蛋白质的核苷酸所隔开,致使一个结构基因被断裂为若干部分。进一步研究表明,基因断裂是真核细胞及其病毒基因组中的普遍现象,这种不连续的被若干序列区域分隔开的结构基因称为断裂基因。断裂基因由外显子(exon)和内含子(intron)两部分组成,分别表示基因的编码序列和非编码序列,在转录过程中内含子和外显子一同被转录,形成初级RNA,初级RNA需要经过剪接加工,以除去内含子序列,并将相关的外显子序列连接成为成熟的有功能的mRNA分子。
不同的断裂基因所含有的内含子数目不一定相同,内含子的大小也变化不定。一般来说,内含子的数量和长度都非常大,初始转录产物会很长,转录后加工时必须剪切除去。以鸡卵清蛋白为例,其基因长达7.7×103nt,有6个内含子,经过剪接后,成熟的mRNA只有1 872nt(图5-6)。
图5-6 鸡卵清蛋白基因结构及其mRNA的后加工
mRNA前体的剪接是高度精确的,一方面取决于外显子和内含子交界处的剪接信号,另一方面取决于5种被称为snRNA的核糖核酸蛋白质复合物。
(1)mRNA前体中内含子的剪接位点:通过比较多种蛋白质基因剪接位点周围的核苷酸序列发现,内含子具有相同的开始和结尾,即总是由GU开始,以AG结尾,此规律称为“GUAG”规律。内含子含有3个保守序列:内含子的5′-端剪接点由GUAAGU组成;3′-端剪接点由(Py)nNPyAG组成,n大约为10,N为任意碱基,Py指嘧啶;3′-端上游18~40个核苷酸处也有一个保守序列,称为分支点(branch site),在酵母细胞是由UACUAAC组成,保守性极强,哺乳动物分支点序列保守性较差。
(2)snRNA:真核细胞的细胞核内含有许多高度保守的小分子RNA(一般≤300碱基),这些RNA统称为snRNA(small nuclear RNA)。在mRNA剪接过程中至少有5种snRNA,包括U1、U2、U4、U5和U6snRNA。这些snRNA分别与特异蛋白质结合成细胞核小分子核糖核蛋白颗粒(snRNP),参与mRNA前体的剪接过程。除了snRNA之外,参与剪接作用的还有若干非snRNA的剪接因子,如SR蛋白(其C端结构域富含Ser和Arg的区域)。snRNA与剪接因子结合构成剪接体。剪接体是mRNA前体在剪接过程中由snRNA和蛋白质组装形成的具有催化剪接反应的多组分复合物。
(3)剪接体的组装及剪接过程:剪接体是剪接反应的场所,它的组装是一个有序、耗能的过程,而其本身也处在动态变化之中。剪接体的组装、发挥剪接作用和解体称为剪接体循环(spliceosome cycle)。通过控制剪接体的组装,细胞可以调节剪接的质量和数量,从而调节基因表达:①组装是从U1与剪接底物(RNA)开始,U1snRNP识别并结合于内含子的5′端剪接点(GU及其邻近序列)。②U2snRNP识别并结合于分支点(此过程需要ATP)。③U4/U6和U5snRNP加入。④U4随后与U6解离,使U2和U6能够通过碱基配对而结合,至此,剪接体全部组装完毕。此时U2和U6snRNP形成催化中心,催化磷酸酯键转移反应。在剪接体上进行的剪接作用,既无水解反应,又无磷酸二酯键数目的改变,剪接反应实际上是转酯反应。⑤通过水解ATP提供能量,完成第一步转酯反应。内含子分支点中A的2′-OH与内含子5′端G的5′-磷酸基团通过转酯反应而结合,形成2′,5′-磷酸二酯键,内含子自身成环,形成套索结构,称套索(lariat)RNA结构。⑥第二次转酯反应亦需要水解ATP提供能量,内含子上游外显子的3′-OH与下游外显子第一个核苷酸的5′-磷酸基团通过转酯反应而结合,形成3′,5′-磷酸二酯键,两个外显子即以磷酸二酯键相连。⑦剪接反应完成后,剪接体所有成分解体,可被再用于形成其他的剪接中间体(图5-7)。
图5-7 mRNA的剪接
4.RNA的编辑(RNA editing) 这是RNA转录后改变mRNA序列的一种加工修饰方式。有一些基因的mRNA在转录后因插入、缺失或替换一些核苷酸而改变了模板DNA来源的遗传信息,从而翻译出许多氨基酸序列不同的蛋白质。
1896年,Benne R所研究的原生动物鞭毛虫的锥体虫线粒体mRNA的编辑加工是目前研究得较详细的一个例子。线粒体细胞色素氧化酶亚基Ⅱ的成熟mRNA的编码区序列比其基因的编码链多出4个U(图5-8),在排除其他因素后,发现这4个U是在转录后添加进去的。
图5-8 锥体虫线粒体细胞色素氧化酶亚基Ⅱ的mRNA序列与其基因编码链序列的比较
RNA编辑的方式主要有两种:一种是在编码区增减一定数目的核苷酸,如绒泡菌线粒体中发现胞苷酸残基(C)的插入编辑,疱疹病毒mRNA中发现鸟苷酸残基的插入编辑。另一种是编码区的碱基发生转换或颠换,如载脂蛋白B mRNA中发现C→U取代编辑。介导RNA编辑的机制也有两种:依赖于指导RNA(guide RNA,gRNA)的编辑和依赖于特定的核苷酸脱氨酶的编辑。RNA编辑的生物学意义在于RNA编辑增加转录产物的多样性,扩大遗传信息;补救某种基因突变,恢复突变中丢失的遗传信息,改变和补充遗传信息的功能;赋予转录产物新的序列,有利于生物进化。
(二)tRNA前体的转录后加工
真核生物多数tRNA前体分子含有内含子,也需通过剪接作用才能变成成熟tRNA。tRNA前体的转录后加工方式有:剪接去除内含子、剪切5′端先导序列、添加或修复3′端CCA以及碱基的化学修饰等。
1.tRNA前体的剪接 tRNA前体的剪接作用是在两种不同酶的作用下完成的,先由内切核酸酶催化进行剪切反应,再由连接酶将外显子连接起来。如酵母酪氨酸tRNA前体有一个14核苷酸的内含子,位于反密码子3′侧,其剪接作用即分两步进行。先由一种与膜结合的内切核酸酶把内含子从tRNA前体上切下,使tRNA前体分成5′端半分子和3′端半分子,然后由ATP提供能量,RNA连接酶把两个半分子连接成为成熟的tRNA(图5-9)。
图5-9 酵母酪氨酸tRNA的加工
2.切除5′端先导序列 除了剪接反应外,真核细胞tRNA前体也存在剪切加工。如酵母酪氨酸tRNA前体5′端有一段由16nt组成的核苷酸序列,称为先导序列(leader sequence)。该序列是由内切核酸酶RNase P水解切除的。
3.添加或修复3′端CCA序列 真核细胞tRNA前体在tRNA核苷酸转移酶催化下,将3′端除去两个U,由CTP、ATP提供C和A,加上CCA序列,形成氨基酸的结合位点。
4.化学修饰 真核生物tRNA前体的加工也存在着化学修饰反应,如甲基化反应:由tRNA甲基转移酶催化某些嘌呤生成甲基嘌呤;还原反应:通过还原反应使某些尿嘧啶还原为双氢尿嘧啶(DHU);核苷内转位反应:通过核苷内的转位反应使尿嘧啶转变为假尿嘧啶核苷(ψ);脱氨基反应:在脱氨酶催化下腺苷酸脱氨基成为次黄嘌呤核苷酸(I)等。
(三)rRNA前体的转录后加工
rRNA前体的加工主要是前体的剪接和化学修饰。
1.rRNA前体的剪接 在哺乳动物基因组中,28S、18S和5.8SrRNA基因串联在一起形成一个转录单位,在基因组中重复几百次,即每个基因有几百个拷贝。每个转录单位之间的间隔DNA序列称为非转录间隔序列(nontranscribed spacers),而一个重复单位内的3个基因之间的间隔序列则是与基因一起转录的,称为转录的间隔序列(transcribed spacers),这些序列在转录后加工过程中被切除。哺乳动物的RNA聚合酶Ⅰ转录产物是45S的rRNA前体,其中含有28S、18S和5.8SrRNA。rRNA前体的剪接是通过“自我剪接”(self-splicing)机制进行的,此过程需要一种核仁小RNA(small nucleolar RNA,snoRNA),snoRNA参与rRNA前体的加工,并指导核糖和碱基的修饰。剪接过程的第一步是剪掉5′末端序列,形成41S的中间体;随后将41SRNA裂解成32S(含有28S和5.8SrRNA)和20S(含有18SrRNA)两段;最后,32SRNA经裂解和修剪,产生28S和5.8SrRNA(可互补结合),20SRNA经修剪后产生18SrRNA。
2.化学修饰 rRNA前体加工的另一种重要形式是化学修饰,主要是甲基化反应。甲基化主要发生在核糖的2′-OH,甲基化可能是作为rRNA前体剪接加工的信号。此外,rRNA前体中的一些尿嘧啶核苷酸通过异构作用可转变为假尿嘧啶。5SrRNA转录产物无需加工,与28SrRNA、5.8SrRNA以及多种蛋白质分子一起组装成为核糖体大亚基后,再转移到胞质。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。