ZDOCK抗原蛋白与抗体刚性对接案例研究纽普生物

在蛋白与蛋白对接软件中，有两款基于快速傅里叶转换（FFT）的刚性对接软件：ZDOCK和PIPER。由于在线版的ZDOCK不会用到ZRANK重排序和聚类分析，我们就以ZDOCK为基础，结合ZRANK和聚类分析看看对挑选模型有没有帮助。

目标模型：6JBT，是PD-1与Fab的复合物结构，分辨率：2.47Å

计算过程：

从6JBT模型中分离Fab与PD1，分别保存为lig.pdb和rec.pdb。对抗原和抗体分子进行处理（去HETATM分子，补齐缺失的氨基酸，加氢等）。

用ZDOCK软件进行对接，生成2000个模型。

用ZRANK软件对对接结果进行重打分和重排序。

计算6JBT与2000个模型的Cα RMSD值、对ZDOCK和ZRANK排序结果计算Cα RMSD值并进行聚类，聚类cutoff为7.5 Å。

计算结果：

一、ZDOCK对接结果

ZDOCK的输出文件已经对结果进行了排序，1为得分最高的模型，降序排列。在线版的ZDOCK一般会提供前10个对接模型。

二、ZRANK排序结果

ZRANK得分越低越好，上表为升序排列。至此，ZDOCK最优的1号模型，经过ZRANK重新打分之后排在了第三位。

三、汇总分析

由于ZDOCK是一款刚性对接软件，对接结果未经过优化处理，因此我们以Cα RMSD来考察模型之间的差异。为了评价计算方法的优劣，我们采用两个参数：1. 接近天然模型的模型数量（N#）和近天然模型富集倍数（EN%）【参考文献：e8 Structure 27, 1041–1051.e1–e8, June 4, 2019】。例如，N5，N50和N500分别表示得分最高的5、50、500个模型中近天然模型的数量。

EN%=[N#/N]/[近天然模型数/总模型数]

对于刚性对接的结果，我们定义Cα RMSD在5 Å及以下的模型为近天然模型。

在2000个模型中，本次实验有79个模型与原始模型的Cα RMSD在5Å以下。

如果以ZDOCK 结果1-10号模型交付，其中近天然模型数为10个，EN%=25.31，平均RMSD为1.242Å；如果选取20个模型，那么EN%=20.25，平均RMSD=5.05 Å

如果以ZRANK结果交付前10个模型，其中近天然模型数为10个，EN%=25.31，平均RMSD为0.935Å；如果选取20个模型，那么EN%=25.31，平均RMSD=1.32 Å

聚类结果

在选取模型的时候，有时候我们不光要考虑程序的打分情况，还要看看根据RMSD聚类的结果。最理想的情况，应该是绝大部分对接结果都集中在打分最高的模型周围。

上图中，展示了前30个聚类结果。对于ZDOCK结果，第二簇的结果是否也是可以接受的，对于这一点是有疑问的（具体要看打分及结合的是否合理）。而ZRANK结果就明显更符合预期一些。

结论：在本案例中ZRANK能提高对接结果的准确性。

Souce: 纽普生物 2020-01-11