FC2ブログ

InChI 表記法(2)

2021-06-30 :  理科部 部活
前回(2021-06-23)の記事:
SMILES 表記法」では、

  ・・・・・
  ・・・・・

  今回、

  分子認識を、(例えば、Open Babel で)行えないか?
  と思った。

  そこで、

  「SMILES InChI mol」検索し、
  Open Babel GUI で、入出力確認を行った。

  “SMILES”でも、“InChI”でも、“Open Babel”では入出力できる。

  “SMILES”の方が良さそうなので、
  3つほど BM(ブックマーク)した。

  ・・・・・
  ・・・・・

  “Open Babel”で、“~.smi”か“~.can”に変換すると、
  分子数を、(ピリオドの数で)数え上げることができますネ。

と書いた。


しかしながら、
“ピリオドの数を数え上げる”ことは、些か手間が掛かる?

そこで、
もう一方の形式:InChIを確認してみた。

その前に、
過去記事を確認すると、
InChI
の如く、10件程度見つかる。

でも実質1、2件ですか。


それで、
適当なデータ:3種類の分子で合計33分子のデータで、
テストをしてみた。



結合情報が定義されている“~.msi”を元にして、
“Open Babel”で、“~.inchi”に変換した。

結果の、
最初の“InChI=1S/”の後に続く、構造部では、

  “4C6H15NO3.24C2H3N.5H2O”

と成っており、

  4分子+24分子+5分子

と識別できる。

これなら、
ピリオドの数は総分子数(-1)じゃなくて、
分子種類数(-1)で済んでいる。



ただし、
結合情報が定義されている“~.msi”を、
一旦、結合情報が(仕様的に定義できない)“~.xyz”に変換して、
そこから、“~.inchi”に変換したのでは、

  “3C6H15NO3.C6H14NO2.24C2H3N.5H2O.HO”

となって、思った通りにはならない?

つまり、

1つの“C6H15NO3”

が、

“C6H14NO2.HO”

の様に別の分子2つと見なされてしまった。


でも、
“~.msi”を“~.xyz”に変換するのでは無くて、
“~.mol”に変換したのなら、結合情報も引き継がれているので、

この“~.mol”から“~.inchi”に変換した場合は、
元の“~.msi”から変換したのと同じ結果になった。



InChIの方が、同一分子の集約を行ってくれるので、
SMILESより、人間に優しい。

だが、結合が曖昧な場合には、
逆にメンドウ(?)になる。



本日はここまで。


見ていただいた序でとは厚かましい限りですが、
お帰りに投票して頂けるとなお嬉しいです。 ⇒

210410
関連記事
スポンサーサイト



コメントの投稿

管理者にだけ表示を許可する

人気blog Ranking



最新記事
カレンダー
07 | 2021/08 | 09
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31 - - - -
月別アーカイブ
カテゴリ
最新コメント
検索フォーム
リンク
プロフィール

<紙>

Author:<紙>
ようこそ。
「パソコンヲタクの雑記帳」
もろもろなことを綴っています。
パソコン ヲタクってねくら?
画像は kami でなく kani です。

FC2 / i2i / Google




Google Analytics
ブックマーク