该工具使用深度学习预测模型进行多肽溶解度预测。
该工具适用于在大肠杆菌中表达的长度少于 200 个残基的多肽或蛋白质。可提供适用范围更广的溶解度预测。
它在预测短肽(<50aa)方面表现出色。AUROC 和准确率分别为 95% 和 91.3%,在预测短肽溶解度方面优于现有的 DSResSol 方法。
训练数据包含来自 PROSO II 的 18,453 条序列(47.6% 为阳性序列,52.4% 为阴性序列)。这些数据的序列长度分布广泛(18 - 198)。
长肽序列(大于 100)的准确率较低。
PROSO II 将可溶性定义为在大肠杆菌系统中可转染、可表达、可分泌、可分离和可溶解的序列。
输入最大长度:200 个残基。