分化了的真核细胞中,往往只表达它所拥有的成千上万的基因中的少数基因,这类选择性表达调控是怎样实现的?研究这个问题不仅有理论意义,也有重大的实际应用价值。在原核生物基因组中,结构基因的转录调控因子,包括阻遏物编码序列,促进子和操纵基因等都是位于它的5′端“上游”的,各部分的功能基本上是清楚的。当人们把原核基因组的调控知识推广、延伸到真核基因组时,很自然地把注意力集中到受控基因的5′端上游。但是,近年来的一些研究报告表明,人类成年型β珠蛋白基因可能存在一个位于转录起始点3′端下游的调控序列。
真核基因的5′端调控因子可分为三类,它们的功能、碱基序列特点和相对于转录起始点的位置各不相同。第一类是最靠近转录起始点的TATA序框,又称为TATA盒,它的序列中含有较多的腺嘌呤和胸腺嘧 啶对,其主要作用是确定转录起始点。一般来讲,多数基因的转录起始点位于TATA序框的下游30个碱基对左右(图4-24)。第二类是5′端调控因子是CCAAT序框,又称为CCAAT盒,其位置变动范围比上述的TATA序框宽一些,往往位于转录起始点上游40~110个碱基对。CCAAT序框的作用主要是决定转录的水平。第三类上游调控因子称为增强子(enhancer)。最先是在猴病毒SV40中发现的,它能在远离结构基因的地方发挥刺激转录、大大提高转录的水平。如果把SV40的增强子和家兔的小β珠蛋白基因组入同一质粒后转染HeLa细胞,可使珠蛋白的mRNA合成增加200倍。另外,有的研究报告还认为增强子可能还有某些基因转录的组织特异性调节因子的作用。
图4-24 真核结构基因的三类转录调控因子
人类基因组中有“下游”调控因子的证据最早来自对β珠蛋白表达调控的研究。成人型的α珠蛋白基因是在出生前后都得到表达的,而成人型的β珠蛋白基因是在胚胎期表达的ε珠蛋白基因和胎儿期表达的γ珠蛋白基因表达之后才开始表达的。为了研究这种随着分化发育而变化的表达调控,查尼(P.Chamey)等进行了一系列基因转移实验。他们先把人的β珠蛋白基因克隆在适当的载体上,然后转入小鼠的红白血病细胞系(简称MEL)细胞。经诱导处理后,在鼠细胞内源α珠蛋白基因和β珠蛋白基因得到转录的同时,外源的人β珠蛋白基因也得到同步表达。接着,查尼用人的α珠蛋白基因做了类似的实验,结果在同样的诱导条件下α珠蛋白基因不能表达。说明人的α珠蛋白基因5′端的调控区对诱导因素不敏感。在上述实验基础上,查尼把人的α珠蛋白基因的5′端上游调控区段和人的β珠蛋白基因的编码区段组合成杂合分子,转染MEL细胞后,再做诱导实验,发现杂合分子上的β珠蛋白结构基因的诱导转录水平与具有完整的5′端上游调控区段的β珠蛋白基因的表达完全一样。同年,赖特等用根本不能被诱导的人胚胎γ珠蛋白基因的5′端促进子区段,或小鼠组织相容性抗原H-2Kbml的促进子区段,和成人的β珠蛋白基因的编码区段组成的杂合分子转染MEL细胞,发现杂合DNA分子的诱导转录活性和完整的成人β珠蛋白基因也是一样的。这一系列实验的结果表明,β珠蛋白基因除了完整的、功能上重要的5′端上游促进子外,还在结构基因内部带有某种对于在红细胞中适当表达至关重要的调控序列。应该指出,人的β珠蛋白基因只是最早被发现转录起始点下游带有表达调控序列的基因之一,实际上这是一个非常普遍的现象。例如,非洲爪蛙(Xenopus laevis)的5S核糖体RNA基因的结构基因段也有调控因子,在小鼠的免疫球蛋白基因的内含子中也发现有一个增强子,鸡的胸腺嘧啶激酶基因内也存在一种基因内调控因子(intragenic control element)。
上面讨论的实验研究引出了一个重要问题:真核基因内含子的功能之一是不是调控外显子表达的速率呢?有人曾经发现某些时间和空间表达同步的真核基因的内含子中,存在或长或短的共同的序列。如果进一步证实这些共同序列与基因的同步表达有关,将成为内含子直接参与基因表达调控的重要证据。另外,从20世纪90年代开展人类基因组计划研究以来,关于基因组中不编码蛋白质的区段在真核基因表达调控过程中的作用已经成为遗传学研究的一个重要内容。毫无疑问,真核生物基因表达调控问题的全貌尚未完全清楚。
实际上,基因表达调控还涉及基因组以外的诸多因素。我们想以级联磷酸化对特定蛋白质的翻译水平的影响为例来说明基因表达的非基因组调控。
把网织红细胞(reticulocytes)的提取液在适当的条件下孵育,它会以相当快的速率合成血红蛋白(hemoglobin的亚单位),直到血红素(heme)用完了才会停止合成。血红素供应中止之所以能导致蛋白质合成降低,原因是在反应系统中很快形成了一种酶性抑制蛋白。这种抑制蛋白的生化本质是一种蛋白激酶,它的靶分子是蛋白质翻译的起始因子eIF-2。eIF-2是8种真核细胞翻译起始因子中最重要的一种,它的作用是和GTP结合,并把met-tRNAf移入核糖体的40S亚单位。eIF-2一旦被激酶磷酸化,则会失活而影响蛋白质合成的起始。图4-25是血红素调节蛋白质合成的示意图。从图中可以看出,能使eIF-2失活的eIF-2激酶有两种存在形态:一种是非磷酸化的钝化态,一种是磷酸化的活化态。eIF-2激酶的磷酸化则是由一种依赖于环磷腺苷的激酶来催化的。这种依赖于环磷腺苷的激酶有4个组分:2个调控亚单位R和2个催化亚单位C,合起来是R2C2。当cAMP存在时,cAMP能把R2C2离解而释出催化组分C,但这个反应经常处于受血红素阻遏的状态。只有当血红素耗尽时,催化组分C才能从R2C2中释出,并活化eIF-2激酶,随之活化态的eIF-2激酶又进而使eIF-2磷酸化而失活,降低细胞的蛋白质合成水平。连起来看,这是一种由多种激酶的级联磷酸化(phosphorylation cascade)在翻译水平对基因功能表达的调控。
近年来关于真核基因组结构和功能的研究大大增进了我们在细胞水平、染色质水平和分子水平上对真核本质的认识。然而,必须清醒地看到,造成分化、发育和性状歧异的主要原因正是真核基因功能表达的调节和控制的关键。对于基因功能表达的多层次、多步骤且具时空特征的调节和控制机制(图4-26),我们至今仍在不断探索。
图4-25 级联磷酸化导致翻译起始因子eIF-2失活(改自L.Stryer)
图4-26 真核基因表达的多层次、多步骤且具时空特征的调节和控制示意
最近20年来的大量研究告诉我们,真核基因功能表达的调节和控制方面最为重要的进展是有关表观遗传学的蓬勃兴起和迅速发展。下一章专门讨论表观遗传学问题。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。