2.5.1 核苷酸序列数据库
目前世界上最大的核苷酸序列数据库是美国的Gen Bank、欧洲的EMBL(Eu-ropean Molecular Biology Laboratory)和日本的DDBJ(DNAData Bankof Japan)三家组成的网络数据库。
Genbank库包含了所有已知的核酸序列和蛋白质序列,以及与它们相关的文献著作和生物学注释。它是由美国国立生物技术信息中心(NCBI)建立和维护的。EMBL核酸序列数据库由欧洲生物信息学研究所(EBI)维护的核酸序列数据构成,Genbank每天都会与EMBL数据库和DDBJ数据库交换数据,使这三个数据库的数据同步。
2003年年底,Gen Bank收录了6万多个物种,3000多万条纪录,超过400亿碱基的记录,每隔大约10个月数据就翻番。Nucleic Acids Research每年的第一期为数据库专刊,不难看出数据库对于生物医学领域应用的重要性。
Gen Bank:http://www.ncbi.nlm.nih.gov/Genbank/。
EMBL:http://www.ebi.ac.uk/embl.html。
DDBJ:http://www.ddbj.nig.ac.jp。
2.5.2 蛋白质序列和结构数据库
(1)Swiss-Prot蛋白序列数据库和Tr EMBL,SWISS-PROT是经过注释的蛋白质序列数据库,由瑞士生物信息学研究所维护。
Swiss-Prot:http://www.ebi.ac.uk/swissprot/。
Tr EMBL:http://www.expasy.org/sprot/。
(2)国际蛋白质序列数据库(PSD)是由蛋白质信息资源(Protein Information Resource,PIR)、慕尼黑蛋白质序列信息中心(MIPS)和日本国际蛋白质序列数据库(JIPID)共同维护的最大的公共蛋白质序列数据库。
PSD和PIR:http://www.pir.georgetown.edu。
(3)蛋白质三维结构数据库(Protein Data Bank,PDB)是美国Brookhaven国家实验室建立的国际上重要的生物大分子结构数据库。
PDB:http://www.pdb.org。
(4)蛋白质结构分类数据库(Structural Classificationof Proteins,SCOP)详细描述了已知的蛋白质结构之间的关系。将蛋白质分为Root(根)、Class(类)、Fold(折叠)、Superfamily(超家族)、Family(家族)、Protein(蛋白)、Species(种)7个层次。
SCOP:http://scop.mrc-lmb.cam.ac.uk/scop/。
(5)PROSITE数据库收集了对生物学有显著意义的蛋白质位点和序列模式信息,并能根据这些位点和模式快速、可靠地鉴别一个未知功能的蛋白质序列应该属于哪一个蛋白质家族。
PROSITE:http://www.expasy.ch/prosite/。
2.5.3 基因组数据库
(1)NCBI的基因组数据库GDB:http://www.gdb.org。
(2)鼠基因组数据库MGD:http://www.informatics.jax.org/。
(3)酵母基因组数据库SGD:http://genome-www.stanford.edu/Saccharo-myces/。
(4)基因组注释系统Ensembl:http://www.ensembl.org/。
2.5.4 药物分子数据库
(1)药物分子数据库Drugbank:http://www.drugbank.ca/downloads/。
(2)美国国家医学图书馆化学身份证(CHEMIDPLUS)数据库:http://chem.sis.nlm.nih.gov/chemidplus/。
(3)美国国家癌症研究所(NCI)抗癌药药物词典:http://www.cancer.gov/dictionary/。
(4)药物合成数据库(drugsynthesisdatabase):http://www.drugfuture. com。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。