3.基因转化图
“人类基因组计划”是解读人的基因组上的所有基因,共分析24个染色体DNA分子中的四种碱基对。30亿个碱基对是一个很长的序列,为了更好地搞清这个长序列,需要有其他辅助工作配合。在“人类基因组计划”中,分为两个阶段:DNA序列图以前的计划和DNA序列图计划。序列图以前的计划包括物理图、转录图、遗传图。
人类基因组的物理图有两个要素:一是序列,二是位置。在如此长的序列中,物理图就像地图一样标明各个序列的路标。通过分子杂交的办法,利用DNA双链互补特点,一个DNA片段杂交在这个位置,“说明这个位置的结构与它相似,就是这个位置的标记,这是以序列作为标记的位置”。
物理图还有更重要的作用,有了前面标志的序列位置,就可以将克隆的DNA片段,一个一个接起来。据中国人类基因组计划负责人杨焕明教授说:“如果两个克隆的DNA片段,都含有某一路标的序列,就说明这两个片段的一部分是重叠的。我们整个基因组的DNA就是由这些相互重叠的DNA片段全部覆盖。换言之,这些DNA片段,就是我们人类基因组这一区域的代表,这些片段的克隆就是我们研究这一区域的实验材料。”
物理图的绘制需要用遗传工程的手段来解决,对年代以来遗传工程所产生的技术,在制作物理图时被利用上了。其中最主要的是克隆技术和分子剪刀。
克隆技术简单说就是不经过亲代的交配,以一个个体的自身为模板复制一个自我的过程。DNA的分子克隆以生物体的细胞为载体,随着细胞的克隆自身也克隆出来。现在使用的技术是DNA片段克隆,就是说,在塑料试管里,克隆出长几百个乃至几十万个碱基对的片段,这是基因工程的基本技术。
做DNA片段克隆需要一种“载体”,最早人们采用质粒作为DNA片段的载体,它把一段段DNA拼接起来,实现自我复制。后来,又有了病毒载体、酵母载体和细菌载体。有的运载量大,有的功能稳定,有的制造容易。使DNA片段的复制手段多样化了。
基因剪接是基因工程最基本的一种手段,长长的DNA分子是一条条键,最短的第22号染色体也有3000万个核苷酸。如何把他们剪开呢?这就要用分子剪刀了。这种剪刀就是酶,它能把DNA从内部切开并能识别特殊的序列。
剪刀有两种,一种是万能的,在任何地方都能剪,另外一种是只能在特殊的地方剪开,这种剪刀叫做限制性内切酶。现在已经发现的内切酶已经有300多种。有趣的是不同的内切酸切开的链子刀口不同。在两条链子组成的DNA中,有的内功酸能把片段的切口仅成平头,有的切成换头,易于重新级结。
除了剪开DNA分子的酶,还有级结DNA分子的酶。有了这些工具,就可以进行基因剪接了。
人类基因组计划要完成的另外一个图谱就是转录图。有1%~5%的基因是指导蛋白质编码的。因为各种生命的现象都是通过蛋白质来表现和实现自己的功能的。因此,抓住了这些能编码蛋白质的DNA,就大致抓住了人类的基因,这就是转录图所要做的事情。
人的每个细胞里所有的DNA决定将近10万个基因,那么在每一种组织的细胞中,只有10%的DNA能表达。
转录是表达的第一阶段,DNA转录后,成为只有一根键的RNA,这个RNA携带信息,所以他被称为mRNA根据遗传密码决定蛋白质。因此抓住这些携带信息的mRNA就成为重要任务。可以说,转录图是基因图的雏形。
在人类基因组计划中,DNA片段的部分序列,被称为可表达的标签序列,到目前为止,在国际合作的人类基因组计划中,这些DNA片段已经被发现了160万,这160万个经过分析和剪接,至少已经代表了上万个不同基因的部分DNA序列。
由于转录图中的这些基因是有表达功能的基因。再者,转录本身是有组织与时间特异性的,它来源于已知的某一生育阶段的某一组织,因此可以给制出在正常条件下基因表达的数目、种类及结构、功能的信息。将来还可以了解不同组织在不同水平、不同表达、不同时间内的表达,这样有了正常和异常的转录图,就可以在此基础上构建基因表达谱了。
由于这种转录的DNA,可以为DNA序列鉴定哪些部分是编码DNA提供可靠的信息,而且这是序列分析中效益最高、收获最快的方案,再者,它本身就有经济价值,可以为基因诊断或基因克隆作为工具,因此转录图的构建和dZNIA片段的分类竞争是十分剧烈。美国私人公司在这方面提出共达40多万个dZNIA片段的专利申请。
遗传图是根据经典遗传学的原理,结合现代分子生物学的进展,以现象来追踪本质的重要工具。
经典遗传学的精髓是遗传分析,在基因和表现之间发现遗传的联系。经过基因组的分析,人们发现一个基因一定在基因组中有其位点,这个位点至少有两个等位基因,一个是正常的,一个是不正常的。如果这个不正常的基因不表达,这个人还是正常的,仅仅是一个携带者。这个位点和全部基因组的遗传标记存在着距离问题,如果位点接近,就会发生交换,距离较远的,交换的频率就高。科学家采用一个遗传标记,来检查家系中这个遗传标记的位点是否与致病位点发生交换。靠物理图就可以在这个遗传标志的相应距离找到这个基因。虽然疾病的原因很复杂,但是利用遗传图就可能分离到这个基因。因此,在遗传图中,家系是一个重要分析对象。序列中的差异就成为最好的“遗传标记”。
物理图、转录图和遗传图都是序列前计划,这些图的绘制,都是为人类基因组的序列图做准备,只有序列图完成了才能将人群内序列的差异,作为密度最高的遗传标记来完善遗传图,因此序列图是人类基因组计划中的最重要部分。
中国参加人类基因组计划的科学家在《生命大解密》一书中详细讲解了人类基因组序列图的绘制工作是如何进行的:
人类基因组DNA序列图的绘制工作,可以做这样的比喻:假说人们只穿4种颜色的衣服,红、黄、白、黑,“人类基因组计划”就相当于把世界上30亿人所穿的衣服都搞清楚,而且注明位置顺序,如所在的国家、城市、街道、楼房、房间。人类基因组DNA序列图的绘制,是在上述3张图的基础上,采用了“分而胜之”的“克隆到克隆”的策略。科学家用已在代表人类基因组中不同区域定好位置的标记,即遗传图的“遗传标记”和物理图的“物理标记”,来找到对应的人类基因组“DNA大片段的克隆”。这些克隆都已知道是相互重叠的。再分别用机器测定每一个克隆的DNA顺序,再把它们按照相互重叠的“相邻片段群”装搭起来。
为了测定这些大片DNA克隆的序列,要将这些DNA克隆按遗传图与物理图的标记,确定在基因组中,切成1~2000核苷酸长的小片段,再“装”到一种质粒“载体”上,送进细菌中克隆,大规模地培养细菌,再从细菌中提取这些“克隆”的DNA。在我国的“北京中心”,工作人员每天要制备5000~1万个克隆的DNA作为测序“模板”。这些DNA要质量上很纯,数量上准确,还不能相互混杂。
模板制备好了,就要进行测序。第一步是“测序反应”。现在使用的方法是“酶终止法”。简单地说,是以要测的DNA为模板,重新合成一条新链,分别用不同颜色的荧光物质标记上。这样,如果一段序列的一个位点上是A,就将代表A的劳火物质标记在A的后面,由此类推。这样就形成了长度相差一个核苷酸的新的DNA链,而结尾一位则可以荣火的颜色来决定的。
测序反应做好后,第二步是上“咱动测序议”分析。现在的机器主要有两类,一类是“凝胶电泳”,另一类为“毛细管电泳”,它们都能将长度仅相差一个碱基的DNA片段—一分开,由于不同的片段尾巴的核苷酸已标有不同颜色的荧光染料,可以很直观地读出A、T、C、G的序列。
这些“序列”通过电脑加工、检查质量,再用一些特殊的电脑程序,将相互重叠的序列装搭起来。要确定每一位置的核苷酸,至少要测定5~10次。如果中间有“空洞”,还要将这些“空洞”用各种技术“补”起来,最后形成一个大片段克隆的完整序列。这些序列片段再根据“相邻片段群”的信息装搭起来,就组合成了一个染色体区域,一个染色体完整序列。
现代的基因组技术是分子生物学、遗传学、遗传工程技术、生物信息学的综合。由于整个生命科学已进入“以序列为基础的时代”,大规模基因组测序、组装与分析技术已成为生物产业最重要的“龙头”、上游技术,这是一个国家的国力、技术能力、新的科研型企业的管理能力、人的素质的最集中的表现。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。