蛋白质的起始模型,常由于相角的解不够完美,使计算出来的电子密度图产生误差,误导模型的走向,因此需要做进一步的改善,称为修正(refinement)。
结构模型的误差来源有1)生物大分子结晶不完美,导致的衍射强度低,误差大;衍射数据分辨率有限;2)相角推算过程引入的误差;3)电子密度的解释和模型构建过程引入的认为的误差。所以为了改进结构模型和衍射数据之间的吻合程度同时保持结构模型的立体化学合理性,就必须要调整参数对结构模型进行修正。
通常对结构可靠性判断的依据有两个重要指标:一个是R因子(Rwork),另外一个是Rfree。Rfree比R更可靠和客观(Rfree>R,通常差值<0.05)。R因子,它被定义为结构振幅的实测值(Fobs)与结构振幅的计算值(Fcalc)之间的残差。一般来说,用同晶置换(MIR)或其他电子密度图构建出来都大分子模型初始的R因子大约为40%-50%,而经过适当修饰后的R因子通常为20%左右。
R因子的应用是计算自由R因子(R-free)。在此法中,大约10%的衍射数据不用于结构精修,而R-free就是根据这些衍射数据计算的(是一道交叉验证的程序)。很显然,自由R因子比R因子会大一些,但应该比较接近。自由R因子与R因子的差值一般在2%-5%的范围内,如果差别大于10%,说明结构是可疑的。根据经验,一个正确的结构,其自由R因子约为分辨率数值的10%。例如,分辨率为2.5埃时,自由R因子应约为25%。小的R因子(≤20%)是结构正确性的重要指标,但并不是绝对的,有些部分错误的结构也能得到小于20%的R因子。
Souce: 纽普生物 2017-12-27