化学是一门古老的科学。在其漫长的发展历史中,积累了大量的实验事实、数据和文献。随着以计算机与网络为标志的现代信息技术的迅速发展,化学信息的数据量日趋增长,形式也呈现多样化。化学家们为了进行科学研究,所需要的信息范围甚广,所涉及的学科范围很宽,这是近代科学的显著特点——学科的交叉性。
化学信息学[1,2]是化学、化工与信息科学、计算科学的交叉学科,它涉及化学化工信息的获取、管理、处理与控制、计算推演与模拟和图形表示的技术与方法。从广义来说,化学信息学中指的信息应该包括化学过程中分子间的相互适应、相互识别,例如在超分子化学形成过程和分子自组装过程中所表达的分子信息。获取化学信息的三个基本途径是:①检索、阅读文献;②实验测量、查阅数据或图谱、数据处理;③根据已有化学知识和物理定理通过计算机推演、大规模计算预测与模拟或再现化学结构、化学性质和化学过程。
7.1.1 化学信息管理软件
二维化学信息管理软件的基本功能包括登录、查询、检索和管理结构信息与数据库。这些信息对于研究和开发新药的过程起着很重要的作用。
7.1.1.1 输入输出
化合物分子结构式作为计算机的输入有碎片码、线形码和拓扑码等几种形式。前两者基本思路是用符号来代表分子结构碎片,并以数字形式来表达这些符号,例如把分子指纹作为输入。拓扑码是用计算机中图论的方法,把分子结构式堪称是拓扑图,以节点代表原子,以边代表化学键。需要注意的是,各节点之间信息不同,代表C、H等,边信息也不同,代表单键、双键和三键。
除了化学结构式以外,数据库中还可输入相关的化合物信息,如化合物等记号、化学名、俗名、制备日期、批号、参考文献、理化性质等。计算机处理后的输出一般可由用户自定义选择。
7.1.1.2 搜索
化学信息管理软件提供的搜索数据库的常见方法有化学结构式搜索、子结构式搜索等。目前较多采用的是相似性搜索(similarity search)。分子相似性是衡量分子之间相似程度的标准,以相似性系数来表示,其值在0~1之间。用户提供一个分子结构式作为提问结构来搜索数据库,从数据库中返回与目标分子的相似的化合物。
7.1.1.3 管理
化合物数据库与其他相关的数据库可以整合到一起,成为一个有力的工具,使得药物化学家同时能够获取和共享从不同的研究与开发数据库中得到重要的信息。故化合物数据库中的信息往往需要采用通用的格式来存储。
7.1.1.4 商业化软件
很多国外的一些大医药公司致力于开发专用的化合物信息管理软件,表7-1列出了一些主要的公司研发的产品。
表7-1 化合物信息管理软件
7.1.2 化学信息数据库
通常数据库由相应的化学信息管理软件中的大量数据组成[3]。各种商业化的数据库内容来源于不同的资料信息,各侧重点也不同,表7-2简要介绍一些比较常用的与药物设计相关的常用数据库。
表7-2 药物设计常用数据库
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。