哺乳动物是二倍体生物,它的细胞有两套分别来自父亲和母亲且相互匹配的染色体。所以,每个细胞中都有两个具有同样表达潜能的基因拷贝。基因组印迹(genomic imprinting)是针对常染色体的一种表观遗传机制,它能限制两个不同亲本来源的基因中的一个在早期发育特定时间的表达。哺乳动物基因的这种亲本特异性表达假设最初是建立在一系列看来是“负结果”的实验胚胎学研究基础之上的,其中包括未经受精孤雌生殖胚胎发育的失败、核移植实验中产生的含有两个父源或母源原核的胚胎都不能存活、遗传了一个亲本染色体的两个拷贝而缺失另一个亲本染色体的胚胎发育异常或成年个体的表型异常,等等。直到1991年,母源特异性表达的基因Igf2r、父源特异性表达的基因Igf2和母源特异性表达的非编码RNA基因H19三个印迹基因(imprintedgene)的发现才确认了亲本特异性表达的假设。基因组印迹也是最重要的哺乳动物表观遗传调控研究模式。
在医学遗传学中,我们往往通过突变来发现新的疾病相关基因。在表观遗传学中,人类基因组中的基因印迹现象也是通过疾病相关的印迹异常被发现的。1956年普拉德(A.Prader)和威利(H.Willi)等医师报道了一种因父源染色体15q11-q13区段缺失而引起的儿童早期发育畸形,患儿肥胖、矮小,并伴有中度智力低下,称为普拉德-威利综合征(Prader-Willi syndrome,PWS)。1968年安格尔曼(H.Angelman)医师又报道了因母源染色体同一区段缺失引起的一种在儿童期以共济失调、智力严重低下和失语等为特征的综合征,称为安格尔曼综合征(Angelman syndrome,AS)。PWS和AS这一对综合征表明父亲和母亲的基因组在个体发育中有着不同的影响,这就是在人类基因组中最早被发现的印迹基因。进一步研究发现,在有些PWS和AS患者中观察到了多种该区段的微小染色体缺失,通过对小缺失的分析发现这段缺失集中的区域有成簇排列的、富含CpG岛的基因表达调控元件,称为印迹中心(imprinting center,IC)。在父源和母源染色体上,这些调控元件的CpG岛呈现甲基化型的明显差异,即父源和母源染色体上IC的甲基化呈现出分化状态,或者叫差异甲基化(differential methylation)。在这个例子中正是两个亲本等位基因的差异性甲基化型造成了一个亲本等位基因的沉默,另一个亲本等位基因保持单等位基因活性(monoallelic activity)。例如,在15ql1~q13区有一段定名为SNRPN的长度为430 bp的调控区段,它含有23个CpG二联核苷。在遗传自母源的染色体上的23个CpG二联核苷完全被甲基化,而遗传自父源的染色体的CpG二联核苷则全都为非甲基化。实验进一步表明,这种呈差异甲基化的IC也是该区段的邻接基因的表达调控元件(图5-10)。1997年美国哈佛医学院儿童医院的木住野(T.Kishino)等的研究证实位于该区段的泛素-蛋白连接酶(ubiquitin-protein ligase)的编码基因UBE3A突变或缺失表达(loss of expression)可以引起AS。AS患者中该基因的缺失表达是由于母源染色体上包括IC在内的染色体片段缺失所致,而PWS患者是由于该区段的多个父源印迹基因的错误表达所致。这种错误表达的后果是邻近基因启动子的从头甲基化和随后产生的基因沉默。
图5-10 PWS和AS相关的染色体缺失片段示意
2011年,陈玲玲(L.Chen)等在研究与人源胚胎干细胞(human embryo stem cell,HESC)命运决定、细胞核亚结构功能,以及基因表达调控过程相关的一些重要的lncRNA时,发现了一类新型长链非编码RNA( sno-lncRNA),这类lnc RNA转录自内含子序列,但在剪接过程中它的两端都接上了核仁小分子RNA(small nucleolar RNA,snoRNA)。出乎意料的是,这类两端戴上snoRNA帽的lncRNA竟然与PWS有关联。在PWS综合征的特征性缺失区15q11-q13存在5个长度不等的sno-lncRNA序列,它们含有多个可变剪接调控因子(splicing regulatory factor)Fox2的特异结合位点,通过调节Fox2在细胞核内的局部浓度,进而影响Fox2对特异mRNA底物的选择性剪接调控(图5-11)。这项研究为进一步揭示这一类lncRNA在PWS综合征发病机制乃至基因迹中的作用提供了新的研究思路。
图5-11 普拉德-威利综合征(PWS)染色体15q12的特征性108 kb缺失片段内含5种snolncRNA序列,造成患者多潜能细胞内snolncRNA分子的缺失(改自Q.F.Yin)
最初发现的另一个疾病相关印迹异常是贝克威思-怀德曼综合征(Beckwith-Wiedemann syndrome,BWS)。它是一种过度生长综合征(overgrowth syndrome),常伴有肥胖和先天性脐疝等症状,并有儿童期肿瘤易患倾向。它起源于染色体11p15.5区段的多种能造成该区段印迹基因表达失衡的遗传学和表观遗传学调节机制异常。在该区段的一个长约1 Mb(相当于1 000 kb)的片段中至少有12个成簇排列的印迹基因(imprintedgene),其中有些呈父源等位基因表达模式,另一些呈母源等位基因表达模式,这些基因分属两个印迹结构域(imprinted domain),它们的印迹状态分别受控于两个印迹调控区(imprinting control region,ICR)。在第一个印迹调控区,主要有印迹基因胰岛素样生长因子2(insulin-likegoowth factor 2,IGF2)基因、H19基因,和一个富含CpG岛的差异甲基化区域(differentially methylated region,DMR),三者的排列次序是5′-IGF2-DMR-H 19-3′。IGF2是一种父源等位基因表达的胚胎生长因子,它的表达上调对BWS的病理过程非常重要。H19是一种母源等位基因表达的polⅡ转录子,是不翻译为蛋白质的长链非编码RNA,它在细胞内的丰度很高,研究提示H19的突变不仅与BWS的发病有关,还与婴幼儿最常见的肾母细胞瘤(Wilms tumor)密切相关。DMR是一个印迹调控区,它借助差异甲基化,以及它特有的CCCTC位点来结合含有11个锌指的染色体屏障调节蛋白CTCF,对IGF2和H19进行交互易换式的印迹调节(reciprocal imprinting regulation)(图5-12)。H19和IGF2的表达要竞争位于H19基因3′下游的一个增强子。在母源染色体上DMR1是非甲基化的,它允许锌指蛋白CTCF与它相结合,从而隔断了IGF2和位于H19下游的增强子,所以该增强子只活化H19的转录。在父源染色体上DMR 1是甲基化的,它不仅使H19基因沉默,使CTCF也因此不能与之结合,结果是父源IGF2基因在增强子作用下活化表达。在这个印迹调控区,相对增强子作用而言,DMR1起了一个染色质屏障作用,被称为隔离子(insulator),在印迹中起关键调控作用。
此外,该区段的第二个印迹调控区也对包括编码细胞周期素依赖的激酶抑制蛋白的基因CDKNIC(p57KIP2)和电压依赖钾离子通道蛋白基因KCNQl在内的多个与细胞分裂周期相关的基因进行类似的调节。如图5-13所示,染色体l1p15区域有两个功能上相互区分的结构域,第一结构域包括上述的印迹基因H19和IGF2。IGF2是在胚胎期父源基因表达的胰岛素样生长因子,H19是母源表达的lncRNA。与H19相关的印迹中心IC1一般在父源染色体上是甲基化的,而在母源染色体上是非甲基化的。因此,H19基因在正常状态下呈现母源表达,IGF2基因呈现父源表达。第二结构域包括CDKNIC、KCNQ1,以及从KCNQ1基因序列转录的KCNQ1OT1。第二结构域的印迹中心IC2包含了KCNQ1OT1启动子的差异甲基化区KvDMR,KCNQ1OT1是一个父源表达的1ncRNA,它对第二结构域中母源表达的印迹基因进行顺式调控。
图5-12 iGF2和H19的交互易换式印迹调节模式示意
P:启动子;DMR1:差异甲基化区;CTCF:锌指蛋白;E:增强子
图5-13 染色体11p15区域与BWS相关的印迹基因簇病理结构示意(改自R.Weksberg)
(a)染色体15的印迹基因簇正常结构示意;(b)BWS患者11p15的印迹基因簇的两种异常结构示意。图中红色为母源表达的等位基因,蓝色为父源表达的等位基因,着色实框为表达的基因,空框为沉默的基因
在贝克威思-怀德曼综合征的状态下,至少有两种不同的印迹异常。图5-13b分别显示了第一结构域中母源染色体上的IC1被甲基化,导致lncRNAH19失表达和第二结构域的KvDMR发生了去甲基化,使KCNQ1OT1得以表达,同时也降低了CDKNIC基因的表达。KCNQ1OT1是存在于核仁的长约91 kb的lncRNA,能与组蛋白甲基化酶G9a和多梳蛋白抑制复合物PRC2结合,在KCNQ1的印迹沉默中起关键作用,而KCNQ1OT1的5′端有一个长度为890 bp专门调节体细胞差异性甲基化的区域,并以此介导KCNQ1OT1和染色质或DNA甲基转移酶DNMT1的相互作用,研究也表明KCNQ1OT1的表达与肿瘤的发生、发展密切相关。
比较基因组学分析还表明,在人染色体14q32区,也有一个与11p15区的Igf2/H 19印迹域非常类似的印迹基因DLK1/GTL2印迹域。DLK1编码一个含6个表皮生长因子重复基序的跨膜蛋白,也呈父源等位基因表达模式,位于DLK1下游的GTL2也编码不被翻译为蛋白质的长链非编码RNA,两者之间也有CTCF特异结合位点(图5-14)。所以BWS提供了一个具有一定典型意义的研究印迹机制的模型,尽管印迹的机制还有多种模式,如正义和反义RNA竞争模式,启动子特异性的交互印迹模式和双印迹中心模式等(图5-15)。但Igf2/H 19模式或者说增强子/染色体屏障调控模式,的确有助于了解基因表达的协调机制,及其在生长发育和抑制肿瘤发生中的重要作用。
图5-14 染色体11q15.5的IGF2/H19区段和染色体14q32的DLK1 /Gt12区段间结构模式比较
图5-15 基因印迹的几种可能途径
(a)DNA直接甲基化;(b)借差异甲基化竞争增强子;(c)建立染色质屏障;(d)染色质结构修饰扩展
分布于基因组的不同区域印迹基因大多成簇排列,其中相当一部分与疾病的发生相关。虽多数印迹基因的作用机制尚不清楚,然而几乎都与DNA甲基化型的异常相关联,也都涉及多种与染色质结构修饰有关的功能蛋白质,以及与这些蛋白质互为分子伙伴的lnc RNA。这些分子复合物通过复杂而有序的正向或负向、顺式或反式作用实现了广泛的表观遗传调控。
值得注意的是涉及不同亲本来源的印迹基因的DNA甲基化型都是在生殖细胞成熟过程中建立的(图5-16)。也就是说,基因组印迹是性细胞系的一种表观遗传修饰,这种修饰有一整套分布于染色体不同部位的印迹中心来协调,印迹中心直接介导了印迹标记的建立及其在发育全过程中的维持和传递,并导致以亲本来源特异性方式优先表达两个亲本等位基因中的一个,而使另一个沉默。哺乳动物中的这种等位基因特异性表达的调控机制往往是与胎儿的生长发育和胎盘的功能密切相关的。虽然印迹基因的数量仅占基因总数的1%左右,但对于胚胎发育中胚胎和胎盘组织的基因表达调控非常关键。本节开始提到的哺乳动物孤雌生殖的不可能,以及通过哺乳动物体细胞核移植来克隆动物的实验频频失败的原因之一,很可能是缺少来自精子和卵细胞的大量印迹基因之间的表达协调。
图5-16 生殖细胞成熟和受精过程中基因印迹的删除和重建示意(仿自J.F.Griffiths)
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。