蛋白质核定位信号预测

核定位序列(Nuclear localization sequence)或者核定位信号——蛋白质的一个结构域,通常为一短的氨基酸序列,它能与入核载体相互作用,使蛋白能被运进细胞核。NLS对其连接的蛋白质无特殊要求,并且完成核输入后不被切除。

1. 蛋白质序列:

全长:0

后验概率threshold [0-1]:

预测模型



核定位序列

入核信号与导肽的区别在于: ①由含水的核孔通道来鉴别; ②入核信号是蛋白质的永久性部分,在引导入核过程中,并不被切除, 可以反复使用, 有利于细胞分裂后核蛋白重新入核。

有多种类型的核定位信号,这些信号都具有一个带正电荷的肽核心。第一个被确定的NLS序列的蛋白质是SV40的T抗原(MW=92kDa), 它在细胞质中合成后很快积累在细胞核中, 是病毒DNA在核内复制所必需的蛋白质。其野生型的氨基酸序列为Pro-Lys-Lys-Lys-Arg-Lys-Val, 即使单个氨基酸突变所产生的突变型NLS(Pro-Lys-Tyr-Lys-Arg-Lys-Val)也能阻止这种蛋白质进入细胞核而停留在细胞质中。如果将这种信号接到非核蛋白的随机Lys的侧链上, 则非核蛋白也能转变成核蛋白。

Karyopherin是一类与核孔选择性运输有关的蛋白家族,相当于受体蛋白。其中imporin负责将蛋白从细胞质运进细胞核,exportin负责相反方向的运输。

该核定位信号预测工具基于NLStradamus 1.8构建。

参考文献

  • Nguyen Ba AN, Pogoutse A, Provart N, Moses AM. NLStradamus: a simple Hidden Markov Model for nuclear localization signal prediction. BMC Bioinformatics. 2009;10:202. Published 2009 Jun 29. doi:10.1186/1471-2105-10-202