抗体序列补全(Ab-X-Completion)

本工具用于补全抗体序列中的 X(Masked Completion)。我们先使用抗体 MLM 模型对所有 X 位点进行逐步填充(每个位点保留 Top-K 候选,并通过 beam search 组合多位点替换),再使用抗体 GPT 模型计算每个补全序列的 PPL,并按 PPL 从低到高重排,返回 Top-N 个最优补全方案。输入序列必须包含 1–8 个 X

支持两种输入:① 单链序列(VH 或 VL,不包含 |);② 配对序列(VH|VL,仅包含 1 个 |,且左右两侧分别为重链与轻链),例如:QVQL...|DIQM...

本工具仅支持单条序列输入。你可以选择种属(人 / 驼科),用于匹配对应的参考统计与打分口径。

1. 抗体氨基酸序列(仅支持 1 条 FASTA):

已解析序列数: 0,总残基数: 0

种属:



模型性能(当前版本)

抗体 MLM 模型性能:
  PPL = 1.39
  Acc = 0.9162

抗体自回归生成(GPT)模型性能:
  PPL = 1.47
  Acc = 0.8974

指标说明

X 将被视为需要补全的 masked residue。MLM 会输出每个 X 位点的候选氨基酸及其 log-probability,并通过 beam search 生成多个完整补全序列;随后 GPT 会对每个补全序列计算 PPL,并按 PPL 排序输出 Top-N。若序列中不包含 X,则不允许提交。

最后更新时间:2026-05-26