生物信息学是一门应用信息科学、计算机科学、生物计算数学、比较生物学等学科的观点和方法对生命现象及其组成分子(核酸、蛋白等)进行研究的学科,它以计算机和生物电子设备为工具,对生物信息进行提取、储存、加工和分析,用信息理论与技术以及生物数学的方法去理解和阐述生物大分子的存在和生命价值,最终对它们进行各种处理与应用。通过这些处理和应用,科学家们不仅能理解已有的核酸和蛋白质序列及其功能,而且能更好地着手研究新的基因和蛋白序列及其功能。
(一)主要内容
在基因组研究时代,生物信息学包含3个重要内容,即基因组信息学、蛋白质的结构模拟,以及药物设计。这三者是紧密地围绕遗传信息传递的中心法则而有机地连接在一起。其中基因组信息学是生物信息学的源头和基础。生物信息学这一领域的重大科学问题有:继续进行数据库的建立和优化;研究数据库的新理论、新技术、新软件;进行若干重要算法的比较分析;进行人类基因组的信息结构分析;从生物信息数据出发开展遗传密码起源和生物进化研究;培养生物信息专业人员,建立国家生物医学数据库和服务系统。生物信息学的研究对认识生命的起源、遗传、发育与进化的本质有重要的意义,可为人类疾病的诊断和防治开辟全新的途径,为生物大分子的从头设计和合理的药物设计提供理论基础,在工业、农业、医学、环境科学等学科中有重大的应用前景。生物信息学的发展将带动医学、药学、遗传学、物理、化学、数学、计算机、网络、微电子、自动化仪器等一大批相关学科和产业的发展。
(二)发展简史
生物信息学是20世纪80年代末以来,随着基因组计划的不断发展以及基因和蛋白数据的迅速增加,信息理论、计算机与微电子技术的飞速发展而逐渐形成的一门崭新学科,是当今生命科学和自然科学的重大前沿领域之一。生物信息学自诞生以来,经历了3个阶段。
1.基因组前期的生物信息学 主要是序列分析、数据库的查询、计算机操作和PC的应用。
2.基因组年代的生物信息学 主要是基因的寻找、数据与数据之间的比较、网络相互界面(interface)。
3.后基因组年代的生物信息学 主要是数据的整合、表达、数据多样性的分析、相互交叉分布数据的总结与分析。
(三)生物信息的产业化
在国际上,生物信息的产业化是在多个学科的交叉研究基础上逐步开展起来的,交叉的学科主要有生物化学、分子生物学、遗传学、生物计算数学、计算机和信息科学、生物物理学等。特别是美国,生物信息的产业化不仅仅只在科研、教育机构,而且还在政府机构和商业企业中进行。近年来,已有大量的资金投入到了生物信息的产业化中,特别是一些专门从事基因组计划研究的公司,例如美国的Human Genome Science(HGS)和InCyte以及法国的Genset。以生物信息研究为中心的研究机构也纷纷在一些著名的大学建立起来,如在Harvard,MIT,Stanford,Illinois以及加州大学的几个分校等。在国际上,北美、欧洲、日本的生物信息学研究处在世界的前列,并取得了一定的成就,其中以美国尤为突出。
随着后基因组年代的到来,当前生物信息产业化的重点逐步转移到功能基因组信息研究,其研究的内容不仅包括基因的查寻和同源性分析,而且进一步到基因和基因组的功能分析,即所谓的功能基因组学研究。具体内容如下。
(1)将已知基因的序列与功能联系在一起研究。
(2)从以常规克隆为基础的基因分离转向以序列及功能分析为基础的基因分离。
(3)从单个基因致病机制的研究转向多个基因致病机制的研究。
(4)从组织与组织之间的比较来研究功能基因组(functional genomics)和蛋白组(proteome)。组织与组织之间的比较主要表现在:①正常与疾病组织之间的比较;②正常与激活组织之间的比较;③疾病与处理/治疗的组织之间的比较;④不同发育过程的比较。
(5)分子进化的研究,基因组研究的一个重要方向是分子序列的进化,通过比较不同生物基因组中各种结构成分的异同,可以大大加深对生物进化的认识。
(6)生物大分子的结构模拟与药物设计。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。