纽普生物

常用SMARTS列表

SMARTS是SMILES基础之上的改进版。SMARTS中增加的一点是,它允许使用通配符表示原子和化学键。因此,它在化合物数据库中广泛用于结构的计算机化搜索。这种搜索的机理是先通过输入的SMILES式重构化学式,再搜索子图的同形;而不是直接通过SMILES式的对比完成的。

SMARTS编码的生成,主要采用JME软件。JME软件是由诺华公司开发的免费开源软件,是一个可以绘画和编辑分子结构的JAVA应用程序,并可以将分子结构存储为SMARTS编码,用于相似结构的检索。

下面是一些常用的SMARTS:

酰胺基:[NX3][CX3](=[OX1])[#6]

一级胺,非酰胺:[NX3;H2;!$(NC=[!#6]);!$(NC#[!#6])][#6]

二级胺:[NX3;H2,H1;!$(NC=O)].[NX3;H2,H1;!$(NC=O)]

氨基酸:[$([NX3H2,NX4H3+]),$([NX3H](C)(C))][CX4H]([*])[CX3](=[OX1])[OX2H,OX1-,N]

将*替换成18种氨基酸(不含Pro和Gly)列表中的侧链,比如丙氨酸侧链是[CH3X4],那么丙氨酸的SMARTS是[$([NX3H2,NX4H3+]),$([NX3H](C)(C))][CX4H]([CH3X4])[CX3](=[OX1])[OX2H,OX1-,N]}

18种氨基酸侧链列表

丙氨酸侧链SMARTS:[CH3X4]

精氨酸侧链SMARTS:[CH2X4][CH2X4][CH2X4][NHX3][CH0X3](=[NH2X3+,NHX2+0])[NH2X3]

天冬酰胺侧链SMARTS:[CH2X4][CX3](=[OX1])[NX3H2]

天冬氨酸侧链SMARTS:[CH2X4][CX3](=[OX1])[OH0-,OH]

半胱氨酸侧链SMARTS:[CH2X4][SX2H,SX1H0-]

谷氨酸侧链SMARTS:[CH2X4][CH2X4][CX3](=[OX1])[OH0-,OH]

组氨酸侧链SMARTS:[CH2X4][#6X3]1:[$([#7X3H+,#7X2H0+0]:[#6X3H]:[#7X3H]),$([#7X3H])]:[#6X3H]:[$([#7X3H+,#7X2H0+0]:[#6X3H]:[#7X3H]),$([#7X3H])]:[#6X3H]1

亮氨酸侧链SMARTS:[CH2X4][CHX4]([CH3X4])[CH3X4]

赖氨酸侧链SMARTS:[CH2X4][CH2X4][CH2X4][CH2X4][NX4+,NX3+0]

甲硫氨酸侧链SMARTS:[CH2X4][CH2X4][SX2][CH3X4]

苯丙氨酸侧链SMARTS:[CH2X4][cX3]1[cX3H][cX3H][cX3H][cX3H][cX3H]1

丝氨酸侧链SMARTS:[CH2X4][OX2H]

硫代酰胺侧链SMARTS:[NX3][CX3]=[SX1]

苏氨酸侧链SMARTS:[CHX4]([CH3X4])[OX2H]

色氨酸侧链SMARTS:[CH2X4][cX3]1[cX3H][nX3H][cX3]2[cX3H][cX3H][cX3H][cX3H][cX3]12

酪氨酸侧链SMARTS:[CH2X4][cX3]1[cX3H][cX3H][cX3]([OHX2,OH0X1-])[cX3H][cX3H]1

缬氨酸侧链SMARTS:[CHX4]([CH3X4])[CH3X4]

甘氨酸SMARTS:[$([$([NX3H2,NX4H3+]),$([NX3H](C)(C))][CX4H2][CX3](=[OX1])[OX2H,OX1-,N])]

脯氨酸SMARTS:[$([NX3H,NX4H2+]),$([NX3](C)(C)(C))]1[CX4H]([CH2][CH2][CH2]1)[CX3](=[OX1])[OX2H,OX1-,N]

Souce: 纽普生物    2020-09-17