2002年11月始发于我国广东的严重急性呼吸综合征(severeacuterespiratory syndrome,SARS),其病原体为一种新型的冠状病毒,称为SARS冠状病毒(SARS-Co V),具有很强的传染性。SARS-Co V冠状病毒是单链RNA病毒,其基因由约30000多个核苷酸组成。SARS-Co V包含5个主要的开放阅读框(ORFs),分别编码病毒的复制酶聚合蛋白;刺突蛋白(spikeprotein);包膜蛋白(envelope protein);囊膜糖蛋白(membraneglycoprotein),核衣壳蛋白(nucleocapsid protein),如图10-1所示。
刺突蛋白(spike protein)与宿主细胞受体结合时,在细胞和病毒之间发生膜融合方面起重要作用。S蛋白中的氨基酸残基的变异也会显著地影响病毒的毒力和病毒对宿主细胞的亲嗜性。在病毒装配时,核衣壳蛋白(nucleocapsid protein)与病毒RNA的包装信号结合,形成螺旋状的核衣壳。N蛋白具有多种生物学功能,在提供核输出信号、参与病毒RNA的复制和包装等方面起作用。N蛋白在SARS-Co V的感染过程中还是主要的抗原部位,具有很强的免疫性和特异性,可产生免疫应答。核衣外壳是含S,M,E蛋白的脂质包膜。囊膜蛋白(membrane protein)的N端结构域常被糖基化暴露在病毒表面,而C端在病毒囊膜里面,是一种跨膜糖蛋白,由氨基端的1个较短的膜外功能区、3个跨膜序列和羧基端的1个较长的膜内功能区组成,具有亲水性氨基端,可以引起宿主产生中和性抗体,跨膜部分和羧基端与病毒装配及出芽有关。M蛋白和N蛋白相互作用,将核衣壳装配成病毒。E蛋白在病毒的包膜成型过程中也起重要的作用。
图10-1 SARS冠状病毒结构(彩图见第402页)
SARS-Co V病毒的复制酶复合体基因占全基因2/3以上,含核苷酸约21000多个,编码两个相互重叠的聚蛋白pp1a(含4377个氨基酸残基)和pp1ab(含7072个氨基酸残基)。聚蛋白pp1ab中包含有主蛋白酶的氨基酸序列,在最初的自动剪切中产生了SARS冠状病毒主蛋白酶(SARSCo VMpro)。生成的SARSCo V Mpro在不少于11个位点上剪切聚蛋白pp1a和pp1ab,由此产生的各种蛋白质和功能多肽完成病毒复制转录的所有功能。SARS-Co VMpro在病毒生命圈中的这种重要作用使它成为抗SARS药物设计的首选靶标。
10.1.1 抗SARS小分子药物设计
10.1.1.1 抑制剂MDL28170
美国的科学家发现组织蛋白酶L的抑制剂可以阻止SARS病毒进入靶细胞,这一研究为病毒蛋白在宿主细胞内的激活机制提出了一个新的研究机制。普通病毒通过细胞表面受体进入细胞,而SARS病毒颗粒感染细胞还要多一个步骤,即SARS病毒颗粒的膜蛋白必须被组织蛋白酶L剪切以后才能在宿主细胞内复制。组织蛋白酶L在囊泡内的酸性环境下发挥作用,酸性环境可以使病毒膜与囊泡膜相融合,促进病毒蛋白和核酸进入宿主细胞,多种组织蛋白酶L抑制剂均可阻断SARS病毒感染人体细胞。这一发现说明组织蛋白酶L对病毒蛋白的剪切是病毒感染的又一重要步骤。所以寻找新的组织蛋白酶L的抑制剂又成为抗SARS病毒感染的又一途径,本章实例介绍基于已有组织蛋白酶L抑制剂MDL21870的药效团开展的对于中药数据库的虚拟筛选,寻找新的小分子化合物作为抗SARS病毒的药物的工作。
Simmons等人的研究中也完成了一个药理学活性化合物的高通量数据库的筛选,而且对于组织蛋白酶L(CTSL)具有抑制作用(IC50=2.5nmol/L)的MDL28170被认为是一个很有效的抑制剂。他们的研究结果证明,在病毒进入靶细胞过程,MDL28170可以有效地抑制SARS病毒的活性,所以MDL28170成为一个以组织蛋白酶L为靶点,较为理想的数据库搜索的模板,MDL28170的结构式如图10-2所示。
图10-2 MDL28170的结构
MDL21870的化学结构是一种氨基端封锁的二肽乙醛,早期的研究可作为钙激活中性蛋白酶的抑制剂防止鼠红细胞膜及相关的细胞骨架蛋白质遭到水解退化(IC50=1μmol/L)并且可能阻止β-淀粉状蛋白加工过程。
10.1.1.2 组织蛋白酶L
组织蛋白酶L是半胱氨酸酶类中主要的一种蛋白酶,它一般发现于哺乳动物细胞类型中,其主要作用是具有分解正常蛋白质的功能,组织蛋白酶L也与另外一些疾病如骨吸收和肿瘤移位有关。
组织蛋白酶L的结构(PDBcode:1ICF)的构象(见图10-3)与木瓜类半胱氨酸蛋白酶相似。蛋白酶由两条链组成,绿色代表heavy chain,红色代表lightchain,蛋白构象包括两个结构域,左(L-)结构域和右(R-)结构域。两个结构域在顶端形成‘V’字形,构成酶的活性中心,中间的裂缝是由2个氨基酸残基Cys25和His163相对组成,分别来自左右两个结构域,形成酶的具有催化剪切作用的2对应体结构。
图10-3 组蛋白酶L(1ICF)结构(彩图见第403页)
Cys25和His163的侧链同时标记出来。
10.1.1.3 相似性搜索和分子对接
相似性搜索是一类重要的数据库搜索方法,它的目的就是从数据库中查找和提问结构在某些特征上相似的分子。至于2个分子之间的相似性的评估,则可以采用多种比较方法。比如可以比较分子式、可以比较两个分子的拓扑组成、可以比较两个分子的物理化学性质、可以比较两个分子的官能团组成、可以比较两个分子的形状特征、可以比较两个分子的分子场特征等。不同的比较方式可能会得到不同的结果。在相似性搜索中最为关心的是两个分子的官能团之间的相似性,因为相似的官能团组成往往会有相似的化学特征。
在两个分子相似性比较中,最常用的就是采用相似性系数的方法。这种方法的优点是可以定量地计算出分子之间的相似性,同时这种方法计算简单,速度快。相似性系数用于描述两个分子之间的相似性,最常用的相似性系数包括Tanimoto系数、Cosine系数以及Euclidean距离,一般都用于二维相似性搜索,其中Tanimoto系数在分子相似性搜索中应用最为广泛。现在很多的数据库搜索系统都采用Tanimoto系数作为相似性的判别指标。一般都用二进制字符串(分子指纹)来描述一个分子,字符串的每一位对应某种分子片段或官能团,1表示分子中存在这种分子片段,0则没有。Tanimoto系数定义:Tanimoto系数=#AB/(#A+#B-#AB)其中#A表示在分子中含有分子指纹A特点的数量,#B是分子中含有分子指纹B特点的数量,#AB表示分子中含有共同拥有A和B的特点的数量。
对接计算采用软件Dock5.3,基于Amberforcefield计算分子间的结合能,计算公式为
Etotal=Evdw+Eele
式中:Etotal是配体与受体的结合能;Evdw是分子间范德华作用能;Eele是分子间静电相互作用能。在计算中,配体分子是柔性的,但受体是刚性的。
计算中每个分子设定输出200个分子构象,分子构象间按照RMSD值<1归类;然后在最终的前100个构象中挑选最佳的分子构象,选择标准兼顾几何构型匹配和结合能量两个参数。
10.1.1.4 实验结果与讨论
首先将中药数据库里的10458个分子建成一个分子数据库,然后计算所有分子的分子指纹,以模板分子MDL21870的分子指纹为提问结构,相似性搜索系数(即Tanimoto系数)设定为0.6,对数据库进行搜索。在含有10458个天然产物分子的中药数据库里一共搜索到26个符合条件的化合物分子。采用常规药物发现的“五原则”:对结果进行进一步的筛选。而对于满足:①氢键供体(OHs和NHs)超过5个;②分子质量(MWT)>500;③lg P>5;④氢键受体(Ns和Os)>10个的分子,一般不予考虑,但有时也会有例外。最终研究人员挑选出11个最佳的分子(见图10-4),这些分子对接的最佳构象的打分如表10-1所示。
图10-4 数据库中查找出符合“5原则”的11个最佳化学分子结构
表10-1 小分子药物与受体(1ICF)对接结合能各项列表
(续表)
依照表10-1的结果显示两个分子Mol736和MDL21870有较高的得分(分值越小代表结合能力越强),Mol736的对接结合能甚至比MDL21870大很多。所以,可以认为Mol736对组织蛋白酶L会有很好的抑制作用。
为了更好地分析两个分子间的共同点,研究人员利用柔性结构比对方法,根据一套预先设定好的分子特性进行叠合计算,分子特性可以设定为分子的形状、lg P、芳香基团、氢键供体或氢键受体等分子特点。图10-5显示两个分子间的柔性叠合的情况,(a)和(b)分别以Chain type和Pharmacophore type显示,其中的Pharma-cophore type显示方案中,白色代表氢键供体;灰色为氢键受体;黑色为疏水性原子。从图10-5可以看出两个分子间有高度的化学相似性,尤其是疏水基团、芳香基团、氢键供体和氢键受体,羰基和氨基及它们的空间位置。
图10-5 分子MDL28170和Mol736柔性叠合(彩图见第403页)
(a)以链型着色,浅灰色代表MDL28170、深灰色代表Mol736;(b)以药效团着色,白色代表氢键供体、灰色代表氢键受体、黑色代表疏水原子
分子间的氢键作用被认为是分子间相互作用的重要参考依据,图10-6显示了两个分子间与受体1ICF的氢键形成情况。分子模拟的结果表明MDL21870分子与1ICF受体有两个氢键,图10-6(a)显示了配体MDL28170和受体1ICF间的氢键作用情况,一个氢键是在MDL21870分子的羰基氧原子和His163(2.05Å)的H (N)之间(2.05Å),另一个是分子的另一个羰基氧原子和Cys25(2.57Å)的H(S)之间(2.57Å)。图10-6(b)显示的是Mol736配体和1ICF之间相互作用情况,总共有三个氢键形成,第一个H键是分子的羰基氧原子与1ICF的Cys25的H(S)之间(2.57Å),第二个是Mol736的H(N)与1ICF的Asp162羰基氧之间(2.16Å),第三个是分子的另一个羰基氧原子与1ICF的Gln19的H(N)之间(2.94Å)。
表10-1的数据表明范德华相互作用能量在结合能中的贡献最大,范德华相互作用是成为结合能的关键参数。图10-7是受体口袋内,以临近配体周围的受体氨基酸残基的疏水性表面绘图,口袋的成分组成是距离配体的6Å之内的所有氨基酸残基构成。受体分子表面以口袋属性着色。
图10-6 分子MDL28170(a)和Mol736(b)与受体1ICF的氢键形成(彩图见第404页)
图10-7显示在活性口袋中的疏水部分与受体的疏水区域有很好的匹配,特别是Mol736分子的两个疏水性芳香基团与活性口袋中左半区域的疏水区匹配得要比MDL28170更好,MDL28170匹配活性口袋的左半区域体积有些偏小,而具有较大疏水基团的Mol736就很好地匹配了这个位置。从几何形状的匹配和结合能两个方面来评价,Mol736都要比MD21870更加适合这个口袋环境,这就为以后的合理药物设计提供了非常有价值的线索。
图10-7 蛋白受体活性口袋与小分子药物(彩图见第404页)
MDL28170(a)和Mol736(b)分子表面。
10.1.1.5 结论
中草药数据库(TCMD)是中华民族的瑰宝,其与现代三维药物设计技术的结合为新药物的研发提供了一个强有力的工具,发现的天然药物一般会有很好的作用效果和很低的毒性。研究确认的组织蛋白酶CTSL(组织蛋白酶L)成为又一个治疗SARS-Co V病毒传染的重要靶点。由于CTSL(组织蛋白酶L)的作用是在病毒与受体细胞的膜融合阶段,所以在这个阶段的抑制作用会比SARS-Co VMpro阶段产生更好的效果。11种中草药分子是根据模板分子MDL28170从TCMD中筛选的,在它们之中Mol736有最高的相似性以及最好的结合能。化合物Mol736 (乙酸橙黄胡椒醯胺脂)是从中草药植物黄花蒿中提取的,其在中医学上有许多功效,譬如治疗气管炎、解除咳嗽、祛痰、解除哮喘等。所以,当年SARS流行时,中药对SARS的预防和治疗也起到了重要的作用,所以挖掘中药的有效成分,让中药成分标准化应当是当前的一项重要任务,相信不久的将来,中药对疾病的预防和治疗将会发挥更大的积极作用。
10.1.2 抗SARS多肽药物的设计
10.1.2.1 研究背景
一种多肽可以被SARS-Co VMpro切割,表明多肽在主蛋白酶的活性部位有很好的结合,并在切割点上有适合于切割的脆弱键。但是,要从一种可以被切割的多肽发展成为SARS-Co VMpro的有效的抑制剂,并进一步发展成为抗SARS的药物,还要在“变形钥匙”模型的指导下,对多肽作化学修饰。在这些研究中,重要的一步是对SARS-Co VMpro与多肽的对接机制的深入理解,找出既可以使多肽牢固地结合在SARS-Co VMpro的活性部位上,又不被主蛋白酶切割的化学修饰的方法。这一研究方案已被成功地运用于Cdk5-Nck5a*-ATP、细胞凋亡,以及阿尔茨海默病等有关研究中。这些宝贵的经验应该作为抗SARS药物发展的借鉴。
水解酶切割多肽或蛋白质的催化敏感部位通常由可容纳8个氨基酸残基的位点组成。虽然被水解的蛋白质或多肽的氨基酸残基数可能远远多于8个,由于水解酶的活性部位仅能容纳8个氨基酸残基,因此在多肽类抑制剂的研究中,八肽的可切割性是研究的重点。本节采用文献的标记法,底物的8个氨基酸残基记作R4、R3、R2、R1、R1′、R2′、R3′、R4′;水解酶的8个位点记作S4、S3、S2、S1、S1′、S2′、S3′、S4′。
如图10-8所示,水解酶的切割点总是在R1和R1′之间,图10-8(a)用细实线加虚线表示肽键的准双键性质,图10-8(b)用粗实线表示经化学修饰后强化了的R1―R1′键,“杂化肽键”不易被水解酶剪切。“变形钥匙”理论认为,一个可以被水解的八肽必须首先牢固地结合在水解酶的活性区的位点上,水解酶通过化学诱导效应削弱R1―R1′间的肽键,促成多肽的水解。所谓“变形钥匙”模型是指通过对可水解八肽的化学修饰,强化R1―R1′间的键,使之既可以牢固地结合在水解酶的活性区的位点上,又不被水解酶切割,像一把插在锁里的被扭曲了的钥匙,既打不开锁,又拔不出来,成为理想的竞争性抑制剂。
图10-8 (a)主蛋白酶Mpro对八肽的切割点在R1和R1′之间;
(b)经化学修饰后的“杂化肽键”R1―R1′得到加强
由于从聚蛋白pp1a和pp1ab的真实切割点上得到的八肽与主蛋白酶有良好的结合性,在受体与配体的竞争性结合上占有先天的优势,因而是开发主蛋白酶抑制剂的最好出发点,也是设计和筛选非肽类抑制剂的模板。事实上经化学修饰后的多肽类抑制剂与非肽类抑制剂已没有根本的差别。
10.1.2.2 蛋白靶点分析
SARS冠状病毒与已知的三组非SARS冠状病毒有明显的差异,SARSCo V Mpro的氨基酸序列与第1组的HCo V(人冠状病毒)和TGEV(猪可转移肠病毒)的主蛋白酶一致性是40%和44%,与第2组的冠状病毒MHV(老鼠肝炎病毒)、BCo V(牛冠状病毒)的主蛋白酶的一致性是50%和49%,与第3组的冠状病毒IBV(感染性支气管炎病毒)的主蛋白酶的一致性是39%。因而SARS冠状病毒称为第4组冠状病毒。研究表明非SARS冠状病毒的主蛋白酶的切割点有高度的特异性和保守性。酶切位点的特异性主要体现在R2,R1和R1′位的氨基酸残基上。其中R1位不变地被谷氨酰胺(Q)占据;R2位出现亮氨酸(L)和缬氨酸(V)的概率是L>V;R1′位出现丝氨酸(S)、丙氨酸(A)和天冬酰胺(N)的概率是S>A>N。这一特异性可表达为...L(V)Q↓S(A,N)...,符号↓表示切割点。尽管三组非SARS冠状病毒的主蛋白酶的氨基酸序列的一致性有限,但主蛋白酶的切割点有高度的保守性。
首先,对非SARS冠状病毒的主蛋白酶的酶切位点的特异性作统计分析,图10-9(a)是用文献的非SARS冠状病毒的训练集的66个酶切位点作的统计分析图。由于SARS与非SARS冠状病毒的主蛋白酶的明显差异,有必要深入研究SARSCo VMpro的剪切特性。基因数据库NCBI里已经报道的不同来源的SARS冠状病毒的基因序列多达162个。为了寻找SARS冠状病毒的主蛋白酶的可切割多肽的结构特征,研究人员找出了27个测序完整、适合于预测的SARS冠状病毒的基因序列,用软件ZCURVE_Co V2.0作基因序列分析,从聚蛋白pp1ab中找到了297个酶切位点。对由此得到的297个可切割多肽的各位点的氨基酸残基作统计分析,结果汇总于图10-9(b)。对比图10-9的(a)和(b),SARS与非SARS的冠状病毒的主蛋白酶的酶切位点的特异性基本一致,主要体现在R2,R1和R1′位的氨基酸残基上,但两者有两点明显区别。一是在SARSCo VMpro的底物位点R1′上出现氨基酸残基A的概率大于出现S的概率;二是SARSCo VMpro的R4和R3位也有一定的特异性,氨基酸残基A出现在R4的概率是36.4%,氨基酸残基T出现在R3位的概率是36.4%。表10-2是在SARS冠状病毒的主蛋白酶的5个底物位
图10-9 可切割多肽的各位点上的氨基酸残基的统计分析
(a)非SARS冠状病毒;(b)SARS冠状病毒
点上各种氨基酸残基出现概率的百分比。
表10-2 在SARSCo VMpro的底物位点上氨基酸残基出现概率的百分比
表10-3列出了用ZCURVE_Co V2.0从多伦多SARS冠状病毒TOR2(基因代码NC_004718,经NCBIRef Seqproject重新标注)的RNA核苷酸序列中预测的11种可切割多肽。切割点在R1和R1′之间,在切割点的左、右各给出了6个氨基酸残基。
表10-3 从SARS冠状病毒TOR2(NC_004718)的聚蛋白pp1a和pp1ab中搜索出的11种可切割多肽
在表10-3的11个可切割多肽中都含有SARS冠状病毒主蛋白酶的真实切割点,在与受体的竞争性结合上占有先天的优势,都是多肽类抑制剂的最好候选物。文献用计算化学方法分析了八肽OP1(NH2-AVLQ↓SGFR-COOH)与SARS冠状病毒主蛋白酶的密切结合。文献中的水解实验证实了八肽OP1可以被SARS冠状病毒主蛋白酶切割。试管实验进一步证实了八肽OP1有很高的抑制SARS冠状病毒的活性,活性达到一半时药物浓度EC50=2.7×10-2mg/L,对细胞没有毒性。
虽然表10-3列出的11种可切割多肽都可以作为SARS冠状病毒主蛋白酶的多肽类抑制剂设计的出发点,但从11个多肽中认真选择最适宜的可切割多肽,对抗SARS药物的设计会有帮助。仔细观察氨基酸在SARS冠状病毒主蛋白酶的特异性位点R4、R3、R2、R1和R1′位上出现的概率(见表10-2),发现表10-3中的八肽OP4(NH2-ATLQ↓AIAS-COOH)和OP9(NH2-ATLQ↓ANEV-COOH)最适宜作为SARS冠状病毒主蛋白酶的多肽类抑制剂的出发点。从表10-2可以看出,这两个八肽在R4、R3、R2、R1和R1′位上的氨基酸A、T、L、Q、A都是在这5个位点上出现概率最大的氨基酸,体现了酶切位点的特异性,预计与SARS冠状病毒主蛋白酶的亲和力最强。
10.1.2.3 竞争性抑制剂八肽的化学修饰
在“变形钥匙”模型的指导下对可切割八肽作化学修饰,使之成为稳定有效的竞争性抑制剂,既要保留可切割八肽与SARS冠状病毒主蛋白酶的良好结合能力,又要强化被切割的脆弱肽键,使之既能与主蛋白酶牢固结合,又不被主蛋白酶切割。化学修饰的要点是把有π键性质的肽键改造成为不适合切割的单键,即“杂化肽键”。根据分子动力学和量子化学计算,提出了几种可能的化学修饰方法。分析这11个多肽的分子结构特征,可提取SARS冠状病毒主蛋白酶与配体的结合作用的有用信息。从表10-3可看出,占据R1位的只能是谷氨酰胺Q,占据R2位的氨基酸L、M、F和V都是有强疏水性侧链的氨基酸,占据R1′位的氨基酸A、S和G都是有小侧链的氨基酸。由于SARSCo VMpro的剪切特异性集中表现在切割点附近的R2、R1和R1′位上,在可切割多肽的化学改造中,这些位点的分子结构的微小改变,都有可能改变配体与受体的结合能力,从而导致与主蛋白酶的竞争性结合能力的丧失。注意到这些位点上的氨基酸结构的特征,对于可切割多肽的化学修饰和多肽模拟物的设计有很大的帮助。
生物信息学发展了精确分析原核生物基因组的方法和软件,为快速发展抗病毒药物提供了有力的工具。基因解析软件ZCURVE_Co V1.0和ZCURVE_Co V 2.0把原核生物的基因解析方法与已有的冠状病毒的知识相结合,能够从SARS冠状病毒的RNA核苷酸序列精确解析出编码蛋白质的基因,并进一步预测SARS冠状病毒主蛋白酶的酶切位点。在这些成果的基础上,本节从酶切位点得到了11种SARS冠状病毒主蛋白酶的可切割多肽,分析了酶切位点的特异性,计算了氨基酸残基在特异位点上的分布概率和氨基酸的结构特征,从而找出了最适宜作为SARS冠状病毒主蛋白酶的抑制剂的八肽NH2-ATLQAIAS-COOH和NH2-ATLQANEV-COOH。从理论上探讨了在“变形钥匙”模型的指导下,对八肽作化学修饰的可能性。这些结论不仅对SARS冠状病毒主蛋白酶的多肽类抑制剂药物的开发有参考价值,也为非肽类抑制剂药物的设计和筛选提供了模板。在本方法中,输入量是病毒的基因序列,输出量是水解酶的可切割多肽。随着基因组学与蛋白组学的深入发展,发现了越来越多的有医疗和生理功能的蛋白与多肽。本方法代表了后基因组时代药物发展的方向。目前已经发展了几种把多肽改造成为稳定药物的系统的化学方法,有可能形成了一条从基因到药物的快捷通道。
10.1.2.4 实验结果与讨论
周国城、魏冬青和钟维珠设计的八肽AVLQSGFR是第一个被合成、并通过试管实验证实为可以被SARS冠状病毒主蛋白酶水解的八肽。为了探讨切割机制,研究人员用分子动力学和量子化学的方法研究八肽AVLQSGFR与SARS-Co V Mpro的相互作用,及被切割部位的化学键的特点。计算分以下几步:①在八肽与SARS冠状病毒主蛋白酶的分子动力学对接计算的基础上,进一步作体系能量最低化计算;②在最低能量构型的基础上,用量子化学的方法计算主蛋白酶的活性部位的原子静电荷的分布;③将主蛋白酶活性部位的原子电荷作为八肽的背景电荷,用量子化学方法计算八肽的分子能量、化学键的特征等;④在同样的背景电荷下用量子化学方法计算化学修饰后的八肽的分子能量、化学键的特征等。
计算使用SARS冠状病毒主蛋白酶的实验结构(PDBcode:1uj1),如图10-10所示。每个单体有三个结构域,单体A和单体B在结构域Ⅲ形成交叉,两者近于垂直,单体B的N端插入单体A的结构域Ⅱ,对单体A的催化活性有重要作用。SARS-Co VMpro的PDB数据还包括了300个水分子。使用MOE(Molecular Operating Environment)程序作SARS冠状病毒主蛋白酶与八肽AVLQSGFR的对接计算,总共得到19个对接构型。选择能量最低的对接构型,进一步作体系能量最小化计算,见图10-11,图中突出了剪切对His41和Cys145的位置。
图10-10 SARS冠状病毒主蛋白酶(SARS-Co VMpro)的实验结构,绿色“<”代表水分子(彩图见第405页)
图10-11 SARS冠状病毒主蛋白酶(SARS-Co VMpro)与八肽AVLQSGFR的对接(彩图见第405页)
SARS冠状病毒主蛋白酶的活性区在结构域Ⅰ和Ⅱ之间的口袋状部位,组氨酸His41和半胱氨酸Cys145组成剪切残基对。在以往的研究中,由于使用的配体和蛋白酶的模型不同,文献对SARS冠状病毒主蛋白酶的活性部位有不同的描述。遵循“宁大勿小”的原则,综合文献中的研究结果,活性位点包括了单体A的Cys22、Gly23、Thr24、Thr25、Leu27、His41、Val42、Cys44、Thr45、Ala46、Glu47、Asp48、Met49、Leu50、Asn51、Pro52、Tyr54、Phe140、Leu141、Asn142、Gly143、Ser144、Cys145、Glu163、His164、Met165、Glu166、His172、Asp187、Arg188和Gln189,还包括了单体B的Phe3、Arg4、Lys5、Met6和Ala7。
在计算中划定的活性区远远多于以上氨基酸残基,包括了距离八肽5Å以内的所有氨基酸残基,如图10-12所示。对接计算表明,SARS冠状病毒主蛋白酶的活性部位完满地容纳了八肽,两者间通过6个氢键牢固地结合,剪切对His41和Cys145位于八肽的R1和R1′间的Gln—Ser肽键的两侧,对肽键Gln—Ser的影响最大。图中肽键Gln—Ser用绿色表示,单体B的氨基端的5个氨基酸残基用红色表示。单体B的N-Finger(N端)与A的Phe140和Glu166有密切结合,是催化活性区的一部分。在组氨酸His41的侧链咪唑环与被切割肽键(Gln)CO—NH(Ser)间有一个水分子桥,该水分子的O原子与Gln的羰基碳原子C(CO)的距离是4.70 Å,水分子的一个H原子与His41的咪唑环的Nδ1的距离是2.39Å,另一个H原子与肽键的氨基端的N(NH)的距离是4.20Å,半胱氨酸Cys145的硫原子与肽键的氨基端的H(NH)的距离是4.12Å。图10-13给出了以上关系的近距离观察。以上距离是用MOE采用分子力学作对接计算,再作能量最低化计算的结果。
图10-12 SARS冠状病毒主蛋白酶的活性区域与八肽AVLQSGFR的位置(彩图见第406页)
受体与配体间的疏水-亲水作用十分重要,根据α-球模型,蛋白酶的活性区由一系列α-球单链组成,每个受体-配体的结合点包括一个或多个α-球,其中至少有一个是疏水的结合点。药物设计软件包MOE提供了观察疏水-亲水表面的功能。图10-14和10-15分别是八肽和SARS冠状病毒主蛋白酶的疏水-亲水表面,两者有很好的一致性:受体的疏水表面对应配体的疏水表面,受体的亲水表面对应配体的亲水表面。八肽AVLQSGFR有4个疏水氨基酸残基,分别在R4(Ala)、R3 (Val)、R3′(Phe)和R4′(Arg),其中R4(Ala)和R3(Val)暴露在溶剂中,R3′(Phe)和R4′(Arg)被蛋白酶的疏水表面包裹。
图10-13 水桥分子在八肽AVLQSGFR与SARS冠状病毒主蛋白酶的活性区中的作用(彩图见第406页)
图10-14 八肽AVLQSGFR的疏水亲水表面(彩图见第407页)
静电相互作用在配体 受体的作用中起主要作用,用量子化学Gauss98W研究SARS冠状病毒主蛋白酶的活性部位对八肽AVLQSGFR的化学键的影响,必须考虑来自环境的静电作用。为描述主蛋白酶的活性部位的静电作用,研究人员把单体A的结构域Ⅰ和Ⅱ的有关氨基酸残基分为7段,单体B的N端取了5个氨基酸残基,表10-4列出了各段氨基酸残基的编号。每段的两头用氢原子和羟基封堵,采用交盖切割法消除切断点引起的误差。用量子化学HF/6-31G方法分段计算原子电荷,扣除重叠部分,以上8段共包括76个氨基酸残基,含1148个原子。溶剂化作用是生物大分子体系的量子化学计算的一个难点。在SARS冠状病毒主蛋白酶的PDB数据中包含了300个水分子(见图10-13)。这些水分子不仅代表了溶剂化作用,有些还直接参加了配体与受体的相互作用,对蛋白酶的水解活性有直接影响。在量子化学计算中研究人员把300个水分子也作为背景电荷处理,总共有1448+900=2048个背景原子电荷。表10-4列出了选用的氨基酸残基和段落的划分。
图10-15 SARS冠状病毒主蛋白酶的疏水亲水表面(彩图见第407页)
表10-4 SARS-CoV Mpro的活性部位的氨基酸残基的分段
为了考查计算得到的原子电荷的可靠性,表10-5列出了氨基酸残基His41的4种原子电荷,q Mull是Mulliken分析法得到的原子电荷,q ESP是拟合范德华表面的静电势得到的原子电荷。半经验法AM1与从头算HF/6-31G的计算结果有较大差异,特别是AM1的q ESP明显不合理,不能使用。由于q ESP在描述静电相互作用上的优点,采用从头算HF/6-31G的静电势拟合原子电荷。组氨酸的咪唑基是一个亲核试剂,它的p K值为6.0,与水的[H+]浓度相当,既可以作为质子的受体,又可以作为质子的给体,在生物体液的条件下有很好的酸碱催化活性。从表10-5看出,组氨酸His41的氮原子Nδ1上的负电荷(-0.4094)和其上的质子H+δ1的正电荷(0.4318)都很大,在位置上最接近R1和R1′间的肽键,对肽键的水解起了主要作用。SARS冠状病毒主蛋白酶切割八肽AVLQSGFR的肽键是通过组氨酸His41的咪唑环上的Nδ1与水桥分子的氢的作用,引起水分子解离后的氢氧根OH-对羰基碳的亲核进攻和水中的质子H+对亚氨基氮的亲电进攻,造成肽键的断裂。半胱氨酸Cys145的硫原子从另一方面与肽键亚氨基端的氢形成氢键,加速了水解反应的发生(见图10-11)。
表10-5 计算得到的氨基酸残基His41的4种原子电荷
表10-6 八肽中与肽键GIn—Ser有关的原子电荷α(单位:e)
观察肽键Gln—Ser的π键平面上的电子云轮廓图,可以更清楚地了解冠状病毒主蛋白酶对被切割肽键的影响。图10-16是八肽AVLQSGFR的肽键Gln—Ser在气相中的电子云轮廓图。电子密度在Gln的羰基碳和Ser的氨基氮周围呈三角形分布,类似于SP2杂化,C(CO)、O(CO)和N(NH)的P电子垂直于平面,形成π键。图10-17是肽键Gln—Ser在蛋白酶中和在气相中的π键平面上的电子密度差图(在蛋白酶中的电子密度减去在气相中的电子密度)。虚线是电子密度减少的区域,实线是电子密度增加的区域。从气相到蛋白酶中,肽键(Gln)C—N(Ser)的羰基碳一侧的电子密度减少,氨基氮一侧的电子密度增加,说明蛋白酶中的亲电诱导效应有利于OH-对C(CO)的亲核进攻和H+对N(NH)的亲电进攻。
图10-16 肽键Gln—Ser在气相中的π键平面上的电子云轮廓图
图10-17 肽键Gln—Ser在蛋白酶中和在气相中的π键平面上的电子云密度差
Anand等人的研究表明冠状病毒主蛋白酶的水解有很高的专一性,八肽的R1位的氨基酸残基一般是谷氨酰胺Gln,说明Gln在该作用点与主蛋白酶有很强的结合力。把八肽AVLQSGFR改造成竞争性的抑制剂的一个方法是通过对八肽作化学修饰,把易水解的Gln—Ser肽键变为不易水解的杂化肽键。如果把肽键一侧的谷氨酰胺Gln的羰基C=O换成CH2或CF2等,或把丝氨酸Ser的NH换成CH2,则π键体系被打破,有可能形成“扭曲的钥匙”,阻止SARS冠状病毒主蛋白酶的水解作用。仅通过计算机模拟可以说明对八肽进行化学修饰的可能性。
表10-7列出了把谷氨酰胺Gln的羰基CO换成CH2或CF2,或把丝氨酸Ser的NH换成CH2后,用从头算HF/6-31G*算出的6个有关原子的电荷。从表10-7看出,把CO换成CH2后,与纯肽键相比,在“杂化肽键”里碳原子的电荷由正转为负,空间位阻增加,OH-的亲核进攻不可能发生;丝氨酸Ser的氨基氮N (NH)的负电荷转为正,质子H+的亲电进攻也不可能发生。把CO换成CF2后,与纯肽键相比(见表10-7),“杂化肽键”里碳原子的正电荷和氨基氮N(NH)的负电荷同时减小,不利于水解反应的发生。把NH换成CH2与把CO换成CF2的情况相似,也不利于水解反应的发生。
表10-7 化学修饰后与杂化肽键GIn—Ser有关的原子的电荷
10.1.2.5 结论
八肽NH2-Ala-Val-Leu-Gln-Ser-Gly-Phe-Arg-COOH是第一个根据SARS冠状病毒主蛋白酶的结构设计出的可水解八肽。文献中在SARSCo VMpro的切割多肽的实验中使用的十肽包括了以上八肽,再一次证实了八肽AVLQSGFR的可水解性。由于可能的八肽的数量巨大,208=2.56×1010,一个有希望成为抗SARS药物的八肽类抑制剂的产生,需要通过对大量可以被水解和不可以被水解的八肽的实验数据的总结,建立训练数据库,按照特定的预测方法(如区分函数法和向量化序列偶合模型)设计出较好的八肽,再根据“扭曲的钥匙”模型,对八肽的被切割肽键作化学修饰,使之变为“杂化肽键”,是化学修饰的重要一步。计算机模拟表明,把八肽AVLQSGFR的谷氨酰胺Gln的羰基CO换成CH2或CF2,或把丝氨酸Ser的NH换成CH2,都不利于SARS冠状病毒主蛋白酶对肽键的切割,有可能使修饰后的八肽成为稳定、有效的抑制剂,或抗SARS药物的先导化合物。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。