本文主要讲述基于ZDOCK算法的蛋白与蛋白之间的分子对接基本过程。ZDOCK算法是提供2个蛋白结构的刚体对接,并根据配体位置对pose进行聚类。该方法还可以利用ZRANK分数对对接的pose进行排序。
开始对接之前需要考虑以下几个因素:
1. 如果受体或者配体蛋白中有确实的原子或者残基,需要补全。
a) 如果缺失的原子或残基在蛋白质表面,即使缺失的部分不在结合位点,预测的对接复合物也可能是错误的。 这是因为具有错误原子/残基的表面可能被错误地预测为结合位点。
b) 如果缺失的原子或残基在蛋白质的核心中,则对预测的影响会降低。
2. 蛋白中只允许出现标准氨基酸的原子或者残基,非标准残基中的原子会被当成是零电荷的碳原子
3. 通常,在进行计算之前应除去水分子。 但是,如果包含水,则将氧原子与未知原子相同(即,作为带零电荷的碳)进行处理。
4. 如果输入的配体或受体具有多个构象(例如,来自NMR实验的结构),则计算将使用第一个构象。 如果应使用第一个构象以外的其他构型进行计算,请应删除指定构象以外的所有构象。
5. 不管输入分子中是否存在氢原子,都不会在计算中使用氢原子。
为了尽可能的提高对接准确性,应充分调研文献或者根据实验结果确定蛋白结合的区域或者残基。这些都可以作为input提交到算法中进行运算。
对于通过X-ray方法获得的蛋白三维结构经常会遇到其中某些区域的残基没有结构,这除了分辨率因素之外,主要还有那些区域的构象不稳定,摆动较大,这些区域一般是无规则卷曲。为了补全这部分氨基酸的结构。通过使用随机调整算法[Shenkin et al。,1987]对闭环构象进行迭代采样来构建缺失区域,以发现与其余蛋白质无交叠或极小交叠的构象。
对接结果分析
生成的对接的结果会按照ZRANK或者ZDOCK分数进行排序,同时还有这些构象的聚类结果。ZDock分数是ZDOCK程序计算的形状互补分数,根据参数设置,ZDOCK分数还将包括静电和去溶剂能项。ZDOCK分数越高越好。ZRank分数是通过ZRANK计分方法计算的对接pose的能量。ZRANK分数越低越好。
聚类结果:由于ZDOCK会产生大量的对接构象,根据形状互补会计算一个得分,再利用这个得分进行排序。形状互补得分仅仅是针对一个pose。 Comeau,Lorenzen和Zhang(Comeau et al.,2004; Lorenzen and Zhang,2007)等人的工作表明,通过聚类来对接结构整体特性的把握可以帮助过滤对接pose。 聚类的依据是RMSD矩阵,2个对接的pose之间的RMSD是根据结合界面中配体残基的距离来计算的。在计算RMSD时,只有重原子才被计算(也就是说氢原子不考虑在内)。
值得注意的是,RMSD矩阵不是对称的。对A,B两种pose来说,计算RMSD(AB)时,残基是由A pose界面残基所定义的;而RMSD(BA)则是在pose B上来定义界面残基。
聚类算法简述:基于RMSD矩阵,选择邻居数量最大的对接pose作为第一个聚类中心,将其邻居分配给第一个聚类中心并从RMSD矩阵中删除。不断的重复上述过程,直到所有的对接pose 都被分配完毕。
优化对接结果(RDOCK)
RDOCK(Li和Chen,2003)是一种修正和优化对接复合物的算法,并使用基于CHARMm的程序进行优化和评分。 ZDOCK预测的对接结构经过优化和重新排序,以挑选出near-native的结构。RDOCK主要由两阶段的能量最小化方案组成,该方案包括评估静电能和去溶剂化能,并最终依据这两项能量之和对优化后的结果进行排序。 在两阶段的能量最小化过程中,RDOCK利用CHARMm(Brooks等人1983)来消除碰撞并优化极性和电荷相互作用。
我们可以对进行能量优化后的结果挑选感兴趣的进行蛋白相互作用分析,以发现:蛋白界面残基组成;界面残基之间的氢键作用;界面残基之间的Pi相互作用和界面残基之间的盐桥等信息。
Souce: 纽普生物 2019-10-20