一、人类结构基因组
结构基因组(structural genome)是人类基因组研究的一个重要内容,其核心是通过绘制基因组的4张图谱解析基因组的全序列,并确定其中所有的功能基因,这4张图谱为遗传图谱、物理图谱、转录图谱和序列图。
(一)遗传图谱
遗传图谱是以具有遗传多态的遗传标记为位标,以遗传学距离为图距的基因组图,又称为连锁图。它是通过计算连锁的遗传标志之间的重组频率,确定它们的相对距离,一般用厘摩(cM)来表示。绘制遗传连锁图的方法有很多,但是在DNA多态性技术未开发时,鉴定的连锁图很少,随着DNA多态性的开发,使得可利用的遗传标志数目迅速扩增。早期使用的多态性标志有限制性酶切片段长度多态性(RFLP);20世纪80年代后出现的有短串联重复序列(STR),又称微卫星DNA遗传多态性分析和20世纪90年代发展的单核苷酸的多态性分析(SNP),到1996年,覆盖全基因组的多态性DNA连锁图谱已构建完成。
(二)物理图谱
物理图谱是描述基因组内特定生物学界标或特定序列的确定位置及它们之间实际距离的基因图谱。人类基因组物理图谱包括两层含义:一是获得分布于整个基因组的位点标记,现在主要是用序列标志位点(STS),其定义是染色体定位明确,且可用PCR扩增的单拷贝序列,数量可达30000个;二是在此基础上构建覆盖每条染色体的可复制的大片段连续克隆系,并确定这些STS位点之间的物理距离(用碱基对表示)。目前,所用的大片段DNA克隆系统包括酵母人工染色体(YAC)、细菌人工染色体(BAC)等。一般首先用YAC系统进行作图,得到重叠的YAC连续克隆系,被称为低精度物理作图,然后将YAC切割成几十个kb的DNA片段,装入其他克隆载体如黏粒(cosmid)中,进行高精度物理作图。
(三)转录图谱
转录图谱的目的是要鉴定出基因组中所有的功能基因以及它们在基因组中的位置。构建的方法主要是从各种cDNA文库中随机挑取的克隆进行测序,所获得的部分cDNA的5′或3′端序列称为表达序列标签(EST),一般长为300~500bp。所测定的人基因组的EST已达180万条以上。这些EST不仅为基因图谱的构建提供了大量的分子标记,而且还为基因的鉴定提供了候选基因。其不足之处在于通过随机测序有时难以获得那些低丰度表达的基因和那些在特殊环境条件下诱导表达的基因。此外,还有其他方法如基因差异表达、基因陷阱、CpG岛分析等多种方法可获得大量的cDNA序列,对转录图谱进行补充。不过,转录图谱的最终确定还有待基因组测序完成后,通过分析基因组序列来获得基因表达的完整信息。
(四)序列图
基因序列图的目标是揭示人类基因组所有DNA分子的核苷酸排列序列,也可以说是最详尽的物理图谱,遗传图谱、物理图谱、转录图谱等都可以在序列图的水平上得到整合。
(五)功能基因组
功能基因组(functional genome)的研究也被称为功能基因组学(functional genomics),它通过在基因组或系统水平上全面分析基因的功能,研究内容包括基因组中所有基因的功能鉴定、基因表达图谱的分析、基因表达与环境之间的调控关系、基因表达与疾病之间的关系等。
基因功能鉴定的通常方法是在细胞水平正义或反义基因的表达后,观察细胞形态和功能变化,更进一步的功能分析则包括个体水平的基因敲除实验等;基因表达图谱的分析则是要建立一种基因表达的多维图谱,分析在不同组织中、发育的不同阶段或者是疾病的不同时期基因的表达情况;任何一个细胞中往往都会有上千个基因在表达,细胞表型或功能的决定不是一个或几个基因表达的结果,因此必须同时对多个基因或蛋白质进行系统的研究,从而能在一个整体的水平对基因的功能有更全面的认识。一些新发展的高通量(high throughput)分析技术包括基因表达的系统分析(serial analysis of gene expression,SAGE)、cDNA微阵列(cDNA mi-croarray)等为基因功能全面系统的分析提供了很好的技术平台。
生物信息学则是在基因组学研究中快速发展起来的一门边缘学科,它以生物大分子为研究对象,以计算机为工具,运用数学和信息系学的观点、理论和方法去研究生命现象,组织和分析呈指数级增长的生物信息数据的一门科学。近年来生物学数据以爆炸性的指数增长方式大量涌现,对这些数据系统、完整的分析将导致新的理论突破或重大科学发现,以此为基础的系统生物学(systems biology)、系统医学已经走在了科学的前沿。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。