首页 理论教育 转录怎么获得基因序列

转录怎么获得基因序列

时间:2023-02-11 理论教育 版权反馈
【摘要】:这种遗传信息由DNA通过转录和翻译,形成蛋白质的过程称为基因表达。他认为生物遗传信息的流向是从核酸到蛋白质。
细胞内遗传信息的流动_分子医学导论

二、细胞内遗传信息的流动

DNA分子中的遗传信息是由4种碱基的不同组合通过转录将其所携带的遗传信息“传抄”给mRNA,进而mRNA通过遗传密码将其翻译成特定蛋白质的氨基酸顺序。这种遗传信息由DNA通过转录和翻译,形成蛋白质的过程称为基因表达。

(一)细胞内遗传信息流动原则:中心法则

细胞内遗传信息的流动方向遵守中心法则(即从DNA转录至mRNA最后流向蛋白质)。1965年由Crick提出中心法则(central dogma)。他认为生物遗传信息的流向是从核酸到蛋白质。此后,由于反转录酶等一系列发现,对其进行了补充和修正。修正后的中心法则还包括mRNA通过反转录酶合成形成DNA的方式(图1-7)。

img9

图1-7 中心法则示意图

(二)遗传信息流动的规则:遗传密码

DNA所蕴藏的遗传信息通过转录和翻译,最后表达形成蛋白质。这种遗传信息的流动(传递)必须遵循一定的规则,即由DNA通过碱基互补转录至mRNA后,由mRNA分子上相邻的3个碱基排列形成1个遗传密码子,最后一个密码子决定合成1种氨基酸,所有密码子称为遗传密码(表1-2)。

表1-2 遗传密码表

img10

在64个密码子中,有3个终止密码子,它们是UAA、UAG和UGA,终止密码子也叫标点密码子或叫无意义密码子,有2个密码子AUG和GUG同时兼作起始密码子,其中AUG使用最普遍。一般认为,遗传密码的特征包括:①密码子的阅读方向与mRNA合成方向一致,从5′端到3′端。②密码子的兼并与兼职现象mRNA有4种碱基,3个相邻的碱基构成1个密码子,所以mRNA可以有43=64个密码子决定所有20种氨基酸。1个密码子决定1种氨基酸,而1种氨基酸可以由2种或2种以上密码子决定,这种现象称为密码子的兼并。具有兼并作用的密码子称为同义密码子。一种密码子具有2种作用被称为兼职密码子,如AUG,既是起始密码子,又是甲硫氨酸的密码子。③遗传密码同样适用于病毒、原核细胞和真核细胞中,具有通用性。④密码子是不重叠的。⑤线粒体中的密码子编码蛋白质不完全等同于常规编码方式。

(三)细胞内遗传信息的流动:基因表达

基因表达(gene expression)是把基因所储存的遗传信息转变为由特定的氨基酸种类和序列构成的多肽链,再由多肽链构成蛋白质或酶分子,从而决定生物各种性状(表型)的过程。

基因的表达有2个基本步骤:①以DNA为模板转录(transcription)合成mRNA;②将遗传信息翻译(translation)成多肽链中相应的氨基酸种类和序列。下面着重介绍mRNA的转录过程。

转录是指在RNA聚合酶的催化下,以DNA的3′→5′单链(模板链)为模板,按碱基互补配对原则(但RNA以U和DNA的A配对,其余配对形式与复制时一致),用三磷酸核苷酸(NTP)为原料合成RNA的过程。转录的最终产物是mRNA、tRNA和rRNA等。合成不同的RNA所需的RNA聚合酶不一样,RNA聚合酶Ⅰ合成rRNA,RNA聚合酶Ⅱ合成mRNA的前体,RNA聚合酶Ⅲ合成snRNA及tRNA等小分子RNA。

1.转录过程一般将mRNA的合成分为起始、延长和终止3个连续的步骤。

(1)起始 RNA聚合酶Ⅱ与启动子(promotor)结合,即可启动RNA的转录合成。用离体诱变方法证实,RNA聚合酶Ⅱ能正确识别和结合启动子序列,这种识别需要有一系列启动因子的辅助,RNA聚合酶Ⅱ的一些启动因子称为通用转录因子,如TFⅡA、TFⅡB、TFⅡD等,TFⅡD中的TBP亚单位可与启动子TATA框特异性结合,与RNA聚合酶Ⅱ及其他启动因子共同组成起始复合物。

(2)延长 转录一旦开始,RNA聚合酶Ⅱ由全酶构型变为主酶构型,并沿着模板链的3′→5′方向移动。在主酶的催化下,精确地按照碱基互补原则,以三磷酸核苷酸(UTP、CTP、GTP和ATP)为底物,在3′端逐个添加核苷酸,使mRNA不断延长。

(3)终止 RNA聚合酶Ⅱ在DNA模板上移动到达终止信号时,RNA就停止。关于RNA转录终止信号的序列目前还不太清楚。在真核基因的3′端存在一此保守序列,如AATAAA。过去认为它是转录的终止信号,但目前研究表明,它只是mRNA3′端附加多聚腺苷酸(polyA)的信号。在哺乳动物的基因中,发现在AATAAA序列下游30个碱基处还有一保守序列,其结构特点是YGTGTTYY(Y:代表嘧啶类核苷酸)。但它是终止信号或是加工信号尚不清楚。转录的终止除涉及到终止信号外,还离不开终止蛋白的作用。终止蛋白能紧密地结合到终止信号上,并能使RNA聚合酶从DNA模板链上脱落下来,使DNA-RNA的杂合体分开,释放出mRNA前体分子。

2.转录产物的加工和修饰由RNA聚合酶Ⅱ催化所形成的初始转录产物,仅仅是mRNA的前体,必须经过加工和修饰,才能形成有功能的mRNA。初级转录物的加工步骤大致如下。

(1)加帽(capping) 即在初级转录物的5′端加上“7-甲基鸟嘌呤核苷酸”帽子(m7GpppN),如在酵母中即是如此。但大多数真核生物除鸟苷被甲基化外,还有一个核糖被甲基化,其帽子为m7GpppNm,少数高等真核生物甚至具有两个核糖被甲基化的帽子(m7GpppNmpNm)。加帽的作用是促进mRNA与核糖体的结合,封闭mRNA5′端使之不能再添加核苷酸和不易被磷酸酶及核酸酶降解,提高翻译的效率。

(2)加尾(tailing) 大多数真核生物的初级转录物均需在3′端加上多聚腺苷酸(polyA)尾,这一过程也称为polyA化。polyA序列并不由DNA编码(即并非转录而来),而是在核内由polyA聚合酶催化所加上的约200个A残基。加尾的功能是延长mRNA的功能寿命,促进mRNA由细胞核进入细胞质,同时,还能使内含子两端剪接位点排列在一条直线上,以进行准确的剪接和加工。

(3)剪接(splicing) 真核生物的结构基因被若干内含子所间隔,因而初级转录物序列中还有由内含子转录而来的非编码序列。只有将这些非编码序列切除,才能拼接成连续而成熟的mRNA。在剪接酶的作用下,将内含子非编码序列切除,再将外显子编码序列由连接酶逐段连接起来,形成mRNA分子。每个内含子的5′端起始处有GT序列,3′端尾部有AG序列,这两个序列为高度保守的一致序列,它们是酶切和拼接的信号。同样,tRNA和rRNA的转录最后也要经过相应的加工和修饰过程才具有功能。

另外,值得一提的是一个基因可有不同的剪接方式,可使同一基因产生不同的蛋白,而且这种现象在人类相当普遍,据估计,人类一个基因平均可编码2~3条多肽链。

还有一种被广泛关注的RNA加工形式称为RNA编辑(RNA editing),是在RNA分子上出现的一种修饰现象,指mRNA在转录后因插入、缺失或碱基替换而改变了DNA模板来源的遗传信息,从而翻译出不同的蛋白质。RNA编辑的结果不仅扩大了遗传信息,也可能是生物适应中的一种保护措施。

3.翻译过程 在蛋白质生物合成中,mRNA是编码蛋白质合成的模板,tRNA是按密码子转运相应氨基酸,核糖体则是蛋白质的合成场所,它不仅组织了mRNA-tRNA的相互识别,将遗传密码翻译成蛋白质的氨基酸顺序,并且控制了多肽链的形成。蛋白质的合成过程包括:氨基酸的活化、肽链合成开始、肽链的延长和肽链合成的终止。

4.基因表达的控制 由于高等生物的不同组织细胞中所表达的基因种类不同,因而,一种组织细胞中通常只有一种或几种蛋白质发挥优势作用,如上皮细胞为角蛋白、结缔组织为胶原蛋白和弹性蛋白、胰岛细胞为胰岛素等。各种优势蛋白质决定各种组织细胞的特殊形态和功能。另外,同一组织细胞在不同的发育阶段所表达的基因也有很大差异。这表明,细胞内基因的表达受到某些因素的调节和控制,使其在正确的时间、正确的地点表达出正确的蛋白。真核生物基因表达的调控机制非常复杂,表达调控的环节众多,目前了解得还不很清楚。

(1)基因序列变化与基因表达的调节 基因序列的变化毫无疑问会引起基因表达的变化,但这种调节方式显然也不可能普遍存在,最早发现的是蛙的成熟卵细胞在受精后的发育过程中其rRNA基因(可称为rDNA)可扩增2000倍,一些哺乳类细胞在一定条件下会对含有利用叶酸所必需的二氢叶酸还原酶(dihydrofolate reductase,DHFR)基因的DNA区段扩增40000多倍,基因的扩增无疑能够大幅度提高基因表达产物的量,但这种调控机制至今还不清楚。在人类,编码抗体蛋白的基因片段通过一定方式的选择与组合而形成编码108种以上抗体的能力,这也是基因序列变化对基因表达的一种调节。

(2)染色质水平上基因活化的调节 真核基因组DNA绝大部分都在细胞核内与组蛋白等结合成染色质,染色质的结构、染色质中DNA和组蛋白的结构状态都影响转录,染色质的活化是基因转录的前提,染色质活化常有一些明显的特征,包括:①对核酸酶作用敏感度增加。染色质DNA受DNaseⅠ作用通常会被降解成200bp整数倍的片段,反映了完整的核小体规则的重复结构。但活跃进行转录的染色质区域受DNaseⅠ消化常出现100~200bp的DNA片段,且长短不均一,说明其DNA受组蛋白掩盖的结构有变化,出现了对DNaseⅠ的高敏感位点(hypersensitive site),DNA高敏感位点常代表反式作用因子的结合位点。②组蛋白甲基化。近几年的研究发现,H3-K9的甲基化与基因的沉默有关,而H3-K4的甲基化却可以使基因活化,且H3-K9的甲基化可招募HP1(heterochromatin proteins)或其同源物并与之结合,从而使基因所在部位异染色质化。③DNA甲基化的变化。真核DNA中的胞嘧啶约有5%被甲基化为5-甲基胞嘧啶(5-methylcytidine,m5C),而活跃转录的DNA段落中胞嘧啶甲基化程度常较低。这种甲基化最常发生在某些基因5′侧区的CpG序列中,实验表明这段序列甲基化可使其后的基因不能转录,甲基化可能阻碍转录因子与DNA特定部位的结合从而影响转录,可见DNA的甲基化是基因表达调控的重要环节。DNA的甲基化和组蛋白的甲基化在基因转录过程中都起着很重要的调节作用,关于两种甲基化之间的关联,目前还没有弄清楚。但是根据现有实验证据可以肯定的是,H3-K9的甲基化与DNA的甲基化在基因的沉默机制中具有协同作用,而H3-K4的甲基化拮抗DNA甲基化所产生的基因沉默。

(3)转录水平的调控 转录水平的调控主要是指对转录的始动、起点的精确性和转录速度等的调节。主要调节因素包括顺式作用元件和反式作用因子。

基因表达的顺式作用元件有启动子、增强子和沉默子(silencer)等,在转录水平的调控上起着重要作用。启动子不仅决定转录的起始位点,而且决定转录的起始效率。在启动子序列中,TATA序列既能保证转录起点的精确性,也可影响转录的效率;CAAT序列是RNA聚合酶结合的位点,并与GC序列一起决定着转录的速度;增强子无论存在于启动子中的部位和方向如何,都能刺激转录活性及增强转录速度。沉默子最早在酵母中发现,以后在T淋巴细胞的T抗原受体基因的转录和重排中证实这种负调控顺式元件的存在,沉默子的作用可不受序列方向的影响,也能远距离发挥作用,并可对异源基因的表达起作用。

反式作用因子是能直接或间接地识别或结合在各顺式作用元件核心序列上,参与调控靶基因转录效率的一组蛋白质。作为蛋白质的转录因子从功能上分析其结构可包含有不同区域:①DNA结合域(DNA binding domain),多由60~100个氨基酸残基组织的几个亚区组成;②转录激活域(activating domain),常由30~100个氨基酸残基组成,这结构域有富含酸性氨基酸、富含谷氨酰胺、富含脯氨酸等不同种类,以酸性结构域最多见;③连接区,即连接上两个结构域的部分。不与DNA直接结合的转录因子没有DNA结合域,但能通过转录激活域直接或间接作用于转录复合体而影响转录效率。与DNA结合的转录因子大多以二聚体形式起作用,与DNA结合的功能域常见有螺旋转角螺旋(helix-turn-helix,HTH)及螺旋环螺旋(helix-loop-helix,HLH)、锌指(zinc finger)、碱性亮氨酸拉链(basic leucine zipper,bZIP)等。

(4)转录后的调控 转录后的调控主要是对hnRNA的加工效率和mRNA稳定性的调节。包括hnRNA的剪接、加帽和加尾等。

(5)翻译水平的调控 翻译水平的调控主要发生在转录起始阶段,包括mRNA稳定性、翻译效率等的调节。

1)mRNA结合蛋白的调节:基因表达时翻译的效率主要取决于mRNA的一级结构和高级结构,mRNA不仅决定翻译速度,而且参与许多翻译调节机制。除了前述加工过程可以增强mRNA的稳定性外,在不翻译时,多数mRNA都与特殊的蛋白质结合形成复合物,以使其不易被降解,但翻译时mRNA必须与结合蛋白分离才具有模板活性,这说明mRNA结合蛋白对翻译的调节具有重要作用。

2)翻译起始因子的调节:起始因子是与翻译的起始有关的重要蛋白因子。它被磷酸化后就失去活性,使翻译的效率降低,而去磷酸化后可使翻译效率得以恢复。此外,某些病毒(如脊髓灰质炎病毒)也可以使一些起始因子降解而失去活性。

3)激素的调节:某些激素能调节mRNA的稳定性,如在体外培养的乳腺组织,无催乳素时,酪蛋白mRNA在48h内降解95%;当加入催乳素时,其mRNA拷贝数增加,在24h内可增至25000个。

(6)翻译后的调控 翻译后的调控主要是对翻译初始产物的加工和组装的调节。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈