2020年夏CCS特集:化学情報協会

無機結晶データ一括取得、MI用途でAPIの反響大

 2020.07.15−化学情報協会が提供している独FIZカールスルーエの無機結晶構造データベース「ICSD」が、マテリアルズ・インフォマティクス(MI)で注目されている。人工知能(AI)/機械学習を行うためには信頼性の高いデータが重要なためで、世界の無機化学領域のMI研究は、ほとんどがICSDに立脚していると言っても過言ではないという。とくに、今年2月から外部プログラムでデータを取得できるAPI(アプリケーションプログラミングインターフェース)機能が追加されたことで、問い合わせが急増している。

 ICSDは、1913年以降に発表された金属や合金、金属間化合物、セラミックス、鉱物など、元素と無機化合物の結晶構造データを網羅的に収録したもので、現在の収録件数は約22万件。収録されているデータの信頼性に定評があり、ICSD内の結晶構造や化合物データから第一原理計算で目当ての物性値を計算し、それを入力として機械学習を行い、その物性を予測するAI構築に役立てることが可能。また、ICSDに収録されたプロトタイプ構造をもとに、さまざまな元素を組み込んで仮想的な結晶を構築し、第一原理計算で構造最適化することにより、未知物質の構造や物性を推定することもできる。二次電池、蛍光体、触媒、半導体、超伝導体、磁性体など、幅広い材料開発を加速させると期待されている。

 通常の使い方では、データをレコード単位でひとつずつ検索しダウンロードしなければならないが、今回のAPIを使うと、スクリプトを書くことで大量データを一括して取得することが可能。これまでの利用契約ではダウロードできるCIFファイルの数に上限があったが、API契約をオプションで追加すると、CIFファイルの制限はなくなる。また、結晶構造中の結合長や角度をCSV形式で、Jmolによる結晶構造図をJPEG形式で、粉末解析パターン画像(JPEG)、x-yデータ(CSV)、書誌情報(TXT)も自在にダウンロードできる。

 現在、1カ月の無料トライアル中で、この4月から5月にかけても、新型コロナウイルス感染が拡大するなか、大学関係で多くのトライアル、正式注文の依頼があったという。ICSDデータベースの既存ユーザーで、すぐにAPI導入を決めた企業もあるなど、化学情報協会ではその反響の大きさに驚いているという。データベース本体の2週間トライアル制度もあるので、MI研究に関心がある幅広い企業や大学に積極的に評価してほしいとしている。


ニュースファイルのトップに戻る