ProtLocPro 是一个面向 原核生物(Archaea / Gram-positive / Gram-negative)蛋白序列 的亚细胞定位预测工具。 模型基于蛋白语言模型特征,并结合多尺度局部模式提取与全局长程依赖建模,可对输入蛋白序列进行六分类定位预测,帮助用户快速筛选候选定位并支持后续功能注释与实验设计。
1. 蛋白质序列(支持10条 FASTA):
已解析序列数: 0,总残基数: 0
支持的定位类别(6类)
- Cytoplasmic(细胞质)
- CytoplasmicMembrane(细胞质膜)
- Extracellular(胞外)
- Periplasmic(周质)
- OuterMembrane(外膜)
- Cellwall(细胞壁)
适用场景
- 原核生物蛋白功能注释
- 分泌蛋白/膜蛋白候选筛选
- 蛋白工程与靶点发现前期优先级排序
- 组学项目中的自动化定位预测模块
模型性能指标
==================================================
--- Overall Test Set Performance Report ---
==================================================
- Accuracy: 0.9111
- Weighted F1: 0.9102
- Macro F1: 0.8279
- Matthews Correlation Coefficient (MCC): 0.8631
Per-Class MCC:
- MCC for class 'Cytoplasmic': 0.9196
- MCC for class 'Periplasmic': 0.7596
- MCC for class 'CYtoplasmicMembrane': 0.8864
- MCC for class 'Extracellular': 0.8029
- MCC for class 'Cellwall': 0.6789
- MCC for class 'OuterMembrane': 0.8069
Classification Report:
precision recall f1-score support
Cytoplasmic 0.95 0.98 0.96 507
Periplasmic 0.74 0.80 0.77 46
CYtoplasmicMembrane 0.92 0.90 0.91 217
Extracellular 0.84 0.81 0.82 104
Cellwall 0.65 0.72 0.68 18
OuterMembrane 0.92 0.73 0.81 75
accuracy 0.91 967
macro avg 0.84 0.82 0.83 967
weighted avg 0.91 0.91 0.91 967
Confusion Matrix:
Cytoplasmic Periplasmic CYtoplasmicMembrane Extracellular Cellwall OuterMembrane
Cytoplasmic 496 4 3 1 0 3
Periplasmic 3 37 3 3 0 0
CYtoplasmicMembrane 11 3 196 3 3 1
Extracellular 8 4 4 84 3 1
Cellwall 1 0 1 3 13 0
OuterMembrane 5 2 6 6 1 55