1998年,Plaxco和Baker[7]考察了蛋白质三级结构的拓扑复杂性和蛋白质折叠速率之间的关系,发现蛋白质的折叠速率的自然对数ln(kf)和接触序(contact order,CO)之间有着反比关系,提出了一个基于参量CO的预测方法,CO的计算公式如下:
式中,nr为蛋白质的氨基酸残基数(即蛋白质序列长度,不包括无规则区域),nc为非局部残基间的接触数,ΔSi,j为接触i和j间的残基数。
这一发现促进了该领域的快速发展。随后,各种与折叠速率相关的经验参量相继提出。Plaxco和Baker又提出用平均相对接触序(the average relative contact order,RCO)[8]来预测蛋白质的折叠速率。紧接着在1999年,Alm和Baker[9]提出了一种利用蛋白质折叠自由能能量曲面ΔG(free-energy landscapes)预测蛋白质折叠速率的方法。同年,Mounoz和Eaton[10]在Alm和Baker模型的基础上提出了一种基于自由能阻碍及结构构象熵的统计力学模型来预测蛋白质的折叠速率;Debe和Goddard根据蛋白质核缩聚折叠机制,也提出一种基于三级拓扑结构预测蛋白质折叠速率的方法[11]。2001年,Dinner和Karplus把CO和ΔG结合共同作为输入向量,利用神经网络方法进行预测的模型既可以用于二态蛋白质,又可以用于三态蛋白质。选23个蛋白质作为训练集,10个蛋白质为检验集时,相关系数可达0.76[12]。Gromiha和Selvaraj提出用长程序(the long-range order,LRO)[13]来预测蛋白质折叠速率。2002年,Zhou H和Zhou Y提出用总接触距离(the total contact distance,TCD)[14]来预测蛋白质的折叠速率。2003年,Zhang等把CO,LRO和TCD这几个参数进行结合,用前向人工神经网络(BP网络)方法对28个蛋白质进行预测,随机选择3个进行检验,相关系数达到0.89[15]。同年,Nölting等又提出链拓扑参量(a chain topology parameter,CTP)来预测蛋白质的折叠速率[16];Ivankov等也提出绝对接触序(the absolute contact order,ACO)来预测蛋白质的折叠速率[17]。除此之外,早在1993年,Fiebig和Dill提出有效接触序(the effective contact order,ECO)[18]来预测蛋白质的折叠速率。以上提到的参量均来自蛋白质的三级结构,说明蛋白质折叠速率与其三级结构有着很强的相关性。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。