2019年冬CCS特集:化学情報協会
化学反応合成経路を予測、反応データからルールを抽出
2019.12.03−化学情報協会は、米ケミカルアブストラクツサービス(CAS)が開発している科学者向け情報検索ツール「SciFinder-n」の提供を加速させる。複雑な検索テクニックを駆使することなく、Googleライクの検索で必要な情報が簡単に得られることが特徴。とくに、逆合成解析によってさまざまな合成ルートを提案する「レトロシンセシス・プランナー」機能が注目されている。
SciFinder-nは、検索したい情報が「物質」「反応」「文献」のどのデータベースに格納されているかを区別したり、化学構造を「完全一致」「部分構造」「類似構造」のどのモードで調べるかなどに悩んだりすることなく、すべて一括して「オール検索」できることが特徴。質問文の意図を解釈し、適合性の高い回答が上位に表示されるなど、圧倒的な利便性と実用性の高さを誇る。従来のSciFinderの上位版としてリリースされて約3年だが、すでに世界で1,300機関が導入済みだ。
とくに評価が高いのが「レトロシンセシス・プランナー」機能。最終的に合成したい生成物を基点に、出発物質までの合成ルートを枝分かれして示すことができる。CASが蓄積した1億2,000万件以上の反応データをもとにして化学反応の経路をさかのぼる。反応ステップ数や収率などの効率性、根拠となる文献の総数、原子効率、出発物質の入手のしやすさ、購入する場合の価格など、合成的知見に基づいた優先付けがされており、妥当なルートを容易に見つけ出すことができる。
現在は反応データを検索しているため、未知の物質の反応経路には対応できないが、反応ルールを知識化して理論的に予測を行う機能が年明けにも実装される予定。化学構造の中で切断したい結合や保護したい結合、さらに適用したい反応ルールの種類(エビデンスの多い一般的な反応を重視するか、理論優先で新奇な反応を重視するかなど)を指定して前駆体を予測する。CASが有する大量の反応情報を利用して継続的に反応ルール/知識ベースを更新し、収率重視やコスト重視など、利用者の好みに応じた反応スキームが提示できるように磨きをかけていく考えだ。
そのほか、CASが新たにリリースした「CASフォーミュレーションソリューション」の紹介も開始した。これは、医薬・農薬、化粧品、食品、日用品などの製剤・配合に関する情報を収集したデータベース。文献・特許だけでなく、製品の添付文書に記載された情報も含めてトータル454万件のデータを集めている。収録元は、英・仏・独・日・中・韓でこの20年間に公表された情報がメインだが、コンテンツの更新は随時行われる。利用するために3種類のインターフェースが用意されており、製剤・配合設計者は専用の「Formulus」、知財・情報担当者は「STNext」で詳細な検索を、一般研究者は「SciFinder-n」でデータを閲覧することができる。