典範SMILES
典範SMILES保证每个化学分子只有一个SMILES表达式。典範SMILES常用于分子资料库的索引。
记法:
1.原子用在方括弧内的化学元素符号表示。
例如[Au]表示"金",氢氧根离子是[OH-]。
有机物中的C、N、O、P、S、Br、Cl、I等原子可以省略方括弧,其他元素必须包括在方括弧之内。
2.氢原子常被省略。
对于省略了方括弧的原子,用氢原子补足价数。
例如,水的SMILES就是O,乙醇是CCO。
3.双键用"="表示;三键用"#"表示。
含有双键的二氧化碳则表示为O=C=O,含有三键的氰化氢表示为C#N。
4.如果结构中有环,则要开启。断开处的两个原子用同一个数位标记,表示原子间有键相连。
环己烷(C6H12)表示为C1CCCCC1。需要注意,标志应该是数位(在此例中为1)而不是"C1"这个组合。扩展的表示是(C1)-(C)-(C)-(C)-(C)-(C)-1而不是(C1)-(C)-(C)-(C)-(C)-(C)-(C1)。
5.芳环中的C、O、S、N原子分别用小写字母c,o,s,n表示。
6.碳链上的分支用圆括弧表示。
比如丙酸表示为CCC(=O)O,FC(F)F或者C(F)(F)F表示三氟甲烷。
异构SMILES
异构SMILES是指扩展的,可以表示同位素、手性和双键结构的SMILES版本。它的一个显着特征是可以精确地说明局部手性。
双键两侧的结构分别用符号/和\表示,例如,F/C=C/F表示反二氟乙烯,它的两个氟原子位于双键的两侧。
而F/C=C\F表示顺二氟乙烯,它的两个氟原子位于双键的同一侧。
发展
SMARTS是SMILES基础之上的改进版。SMARTS中增加的一点是,它允许使用通配符表示原子和化学键。因此,它在化合物资料库中广泛用于结构的电脑化搜寻。这种搜寻的机理是先通过输入的SMILES式重构化学式,再搜寻子图的同形;而不是直接通过SMILES式的对比完成的。
其他记法及比较
其他着名的线性记法包括Wiswesser Line Notation(WLN),ROSDAL和SLN。最近国际纯粹与套用化学联合会推荐国际化合物标识(InChI)作为标準的分子式表达式。
然而普遍认为,SMILES与InChI相比更具有可读性;而且很多软体都支持SMILES,其中不少软体都具有图论等方面的理论基础。


















