蛋白质可溶性预测

从重组蛋白的生产到生物治疗剂的开发,蛋白质的溶解度都是一个重要的属性。尽管有对相关物化性质越来越多的理解,但是预测仍是一项挑战。本工具基于序列预测蛋白质可溶性。它基于对无细胞表达的大肠杆菌蛋白质溶解度双峰分布的观察( (Niwa et al., 2009)),这些测量报告了一种蛋白质的可溶性部分(在离心后的上清液中)与该蛋白质的总量之比,而不是一种热力学属性。该工具计算35种特征,包括:20种氨基酸组成;7种氨基酸组合:K-R, D-E, K+R, D+E, K+R-D-E, K+R+D+E, F+W+Y;8种预测的特征:长度、等电点、疏水性、pH=7.0时蛋白的净电荷、折叠倾向、无序区、序列熵、和β链倾向。结合35个特征的线性模型给出了对溶解度数据的初步拟合。返回值介于0-1之间,如果高于0.45,意味着蛋白的溶解性可能比数据集 Niwa et al 2009的均值要高。

1. 输入单条蛋白序列(非FASTA格式):

全长:0

说明

预测蛋白在大肠杆菌中是否能可溶表达是个很有挑战性的工作。是否能可溶与蛋白构建方式、蛋白表达条件、蛋白来源、是否需要翻译后修饰、序列本身都非常有关。

为了更直观的理解这个数值,我们计算了常用几种融合标签的溶解性值:

  • TrxA: 0.765
  • GST:0.416
  • SUMO:0.932
  • NusA:0.748
  • MBP:0.588
  • GFP:0.592
  • HaloTag:0.430
  • GB1:0.899

参考文献

  • Hebditch M, Carballo-Amador M.A., Charonis S, Curtis R, Warwicker J. Protein-Sol: a web tool for predicting protein solubility from sequence. Bioinformatics (2017)