在之前的例子中,已经介绍了有关定量构效关系的方法,这里不再赘述。由于定量构效关系(QSAR)研究在现代药物设计方法中的重要地位,所以将在这节再举例来加强对这一方法的理解。
10.4.1 研究背景
10.4.2 化合物及活性数据的选择
训练集的20个分子取自文献,测试集是由本课题组合成的4个分子和取自文献的编号3和编号7(见表10-22)组成的。QSAR中使用的活性数据最好为同一实验室的同一批试验数据,这样可以减少系统误差,具有可比性和说服力。因为新药开发过程中,进行初筛是以对标准菌体外抑制程度来衡量的,在收集数据时发现,有几个化合物对耐药菌的抑菌浓度反而小于对标准菌的抑菌浓度,所以统一使用对标准菌的体外抑菌数据,本节是以对标准金黄色葡萄球菌S.aureus Smith的体外最小抑制浓度MIC(μg/ml)作为研究的活性数据。由于条件的限制,对合成的新化合物体外抑菌活性的测试是用标准金黄色葡萄球菌CMCC26003测定的。
表10-22 来自文献的22个分子的最低能量构象的相关数据
10.4.3 活性构象及叠合规则的确定
图10-41 唑烷酮类化合物的结构
从表10-22可知,最小能量的分子并不一定具有最高的活性,而其对应的构象不一定是药效构象,药效构象容许热力学上不稳定的构象,其能量差值从与受体相互作用中得到补偿。
10.4.4 分子的叠合
化合物构象式的叠合是影响Co MFA结果的关键步骤,不当的叠加方式甚至得出错误的结论,因此叠合方式要经过比较选择,选择q2最大的叠加方式,比较了两种叠合方式,如图10-42所示。叠合方式1所得到的q2为0.615,而叠合方式2的q2为0.681,故采用叠合方式2进行叠加。此外每个化合物均有几个能量相差很小的低能构象,采用哪个低能构象式去叠加也需要经过尝试。以活性最高的化合物11的最低能量构象为模板。将分子中有共同原子特征的骨架结构(见图10-36)叠合(带*号原子为叠合原子)。在SYBYL中Aligndatabase模块中将所有的分子进行叠合,如图10-43所示。
图10-42 叠合模式图
图10-43 20个分子的叠合图
10.4.5 模型搭建
所有分子模拟和计算工作是由Tripos公司的SYBYL/7.0软件完成的。分子力场计算以SP3杂化C+原子作为探针,电荷为+1.0,步长为设为1,1.5,2,2.5, 3.0Å计算探针在x(-12.5Å,15.2Å),y(-8.2Å,9.2Å),z(-8.0Å,11.3Å)三维空间的每个网格点上与药物分子的相互作用能。步骤如下:电荷计算采用Gasteiger-Hückel法,立体作用能用Tripos力场计算,静电作用能用库仑模型计算,介电常数选用与距离成正比的模型(D=r);计算立体作用能和静电作用能时设定阈值(cutoff)为125.4k J/mol,柱滤值(column filter)为8.36k J/mol。Co MFA由SYBYL7.0中QSAR模块完成。围绕所有分子的三维网格使用create automati-cally完成,偏最小二乘法分析与交叉验证方法(1eave-one-out)相结合的方法得出最佳主成分数,再经非交叉验证得到目标模型。
Co MSIA也由QSAR模块完成,衰减因子设置为0.3,Co MSIA计算力场选用立体场、静电场、氢键供体场、氢键受体场和疏水场。氢键相互作用对于药物分子和受体的结合非常重要,对于某些体系,引入氢键场以后可以明显提高模型的预测能力,但也有人也认为氢键相互作用实际上是静电效应的结果,它可以包含在静电效应中。在实际体系研究中,加入氢键场有时也并不一定能够提高模型的统计学质量,是否在模型中加入氢键场要根据实际的情况仔细选择。
10.4.6 COMFA和Co MSIA结果比较
由表10-23可以看出,Co MFA模型所得的回归相关系数较高,说明在分子母核呈刚性的条件下,分子叠合得很好,所得的模型预测能力也较好。而Co MSIA所得的几个模型均不如对应的Co MFA模型的可信度高,Co MSIA方法对于空间取向不定的柔性分子较为适宜,而这里研究的是刚性较大的分子体系,其构象相对固定,未能体现其优越性。Co MFA最佳模型(2Å)给出的统计结果是,交叉验证的相关系数q2=0.681,最佳主成分数为6,传统相关系数r2=0.991,标准偏差SE=0.054,可信度F=266.98,立体场和静电场的贡献分别为0.548和0.452,表明立体场和静电场均为重要的影响因素,立体场的影响更为重要,得到了Co MFA模型系数的等势图,它的建立不仅验证了已有的构效关系,而且定量地说明受体的活性部位对分子力场的要求。
表10-23 Co MFA和Co MSIA结果及模型
(续表)
10.4.7 2D模型与3D模型的比较
利用MOE中的QSAR计算模块,给上述训练集的全部分子首先选择适当的描述子(descriptor),然后用偏最小二乘法拟合实验数据得到一个QSAR模型:
p MIC=2.26214-0.00182pmi Y+0.01957TPSA-
0.33759dipole Y-0.34918a_don-0.00316zagreb
式中:TPSA为用基团的贡献来近似计算极化表面积;pmi Y为主惯性矩在y轴上的分量;Dipole Y为偶极矩在y轴上的分量;a_don为氢键受体的原子个数(不计算碱性原子的个数,而是计算既是氢键给体又是氢键受体的原子如—OH);Zagreb为所有重原子的d2i。非交叉验证的r2fit为0.9241,均方根偏差(RMSE)为0.1265。
描述子的相对重要性依次为:pmi Y1.0000、TPSA0.9032、a_don0.5404、dipole Y0.413542、zagreb0.051080。3D-QSAR所得的模型的主成分数为6个,而2D模型的描述子为5个,为了进一步证明3D模型的可靠性,用此模型对同一个测试集进行验证。从图10-44、图10-45可以看出[图中MIC为标准金黄色葡萄球菌S.aureus Smith的体外最小抑制浓度(μg/ml);MW(molecular weight)指分子质量],2D预测效果总体来说不如3D好,值得注意的是两者对N4的预测结果截然不同(见表10-24、表10-25),就是用3D-QSAR模型预测的N4的活性很差,可能因为2D模型能够宏观地评价一个分子的抑菌活性。所以加强2D-QSAR和3D-QSAR的联系很有必要,往往能够相互补充、相互提示。
图10-44 2D-QSAR中化合物实际活性和预测活性之间的关系
图10-45 3D-QSAR中化合物实际活性和预测活性之间的关系
表10-24 26个分子结构及2D-QSAR模型对其体外活性预测的有关数据
(续表)
表10-25 26个分子结构及3D-QSAR模型对其体外活性预测的有关数据
(续表)
(续表)
注:p MIC=-lg(MIC/MW),3*、7*、N1、N2、N3、N4共同组成测试集,编号1~22的MIC是用标准金葡菌S.aureus Smith测得,N1~N4的MIC是用标准金葡菌CMCC26003测得。
10.4.8 Co MFA分子场的等值面图与新化合物的设计
Co MFA计算得到的3D-QSAR结果是以三维等值面图(见图10-46)的形式表示的。红色和蓝色区域代表静电效应,绿色和黄色代表立体效应。绿色区域代表在该区域引入大体积的基团有利于活性的提高,黄色区域表示不宜有大的取代基;蓝色区域则表示提高正电荷有利于活性的提高,红色区域表示提高负电荷有利于活性的提高。从图中可以看出,与苯环相连的六元环的2-位上引入电负性大的基团、5-位上引入体积大的基团有利于活性的提高,唑烷酮环的5-位所连接的S构型的碳原子上连接电负性大和体积大的取代基有利于活性的提高。据此,对利奈唑酮的
唑烷酮环5-位进行结构修饰,设计合成了新化合物N1、N2、N3、N4的S构型的碳原子上分别以
、
、、
替代利奈唑酮的
中磺酰基的是强吸电子基,不仅是自身的电荷密度增加,同时使与其相邻的给电子基团甲基的电荷密度削弱,按照Co MFA给出的信息应该有利于提高活性;
也是吸电子基
, 属于体积大的基团,它们的引入应该有助于活性的提高,在对它们的构象进行系统搜索时发现,N1、N2、N3的最低能量构象符合研究人员所建立的药效基团模型的要求,而N4却有所偏离(见图10-47,表10-26),主要是二面角超出-3.1°~9.4°这个范围,为18°致使苯环与
唑烷酮环不在一个平面上,可能会影响与受体的结合,而且能量在所研究的26个分子中能量是最高的,又因为药效构象不可能是能量最高的构象,有可能是活性不太好,但用QSAR模型进行预测活性却较好,N1、N2、N3的活性很好,为了作佐证模型的有效性及实用性,决定将它们一起合成。合成后N1、N2、N3的活性实验值与用Co MFA给出的最佳模型所进行的活性预测值基本接近,如图10-47所示,而N4却无活性,与预测值偏差太大。
图10-46 Co MFA模型的等值面(彩图见第411页)
图10-47 N4最低能量的构象(彩图见第412页)
表10-26 新化合物的最低能量构象的有关数据
图10-48 新化合物N1的分子表面(彩图见第412页)
10.4.9 结论
本节对唑烷酮类化合物的构效关系进行了研究,在Co MFA指导下对利奈唑酮的
唑烷酮环5-位进行了结构改造,筛选出了药效基团,确定了有效的3D-QSAR模型,为进一步优化活性化合物的结构打下了基础。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。