JSOLが「J-OCTA」に機械学習機能を搭載

MI研究へのニーズに対応、DeepChemで深層学習

 2019.06.26−JSOLは、材料物性解析ソフトウエア「J-OCTA」に機械学習に対応した機能を追加し、提供開始した。ユーザーの間で関心が高まっているマテリアルズ・インフォマティクス(MI)への取り組みを後押しするもので、高分子の分子構造と材料物性との関係を機械学習し、予測モデルを構築することができる。手持ちの材料データやJ-OCTAの計算結果を学習に利用することができるほか、密度やガラス転移温度などの学習済みモデルも内蔵されている。将来的には別売りオプションとすることを検討しているが、ユーザーは当面無償でこの機能を利用することができる。

 今回の新機能「深層学習を用いたQSPR機能」は、5月にリリースされたJ-OCTAの最新バージョン5.0で利用することが可能。もともとQSPR(構造物性相関解析)機能が組み込まれているが、相関モデルを作成するに当たり、これまでの統計的手法に加えて機械学習が利用できるように拡張した。

 採用した学習方式は深層学習の一種であるグラフ畳み込みニューラルネットワーク(GCN)で、分子構造を物性値との関係を学習する。まず、モノマーの分子構造をSMILESで表記し、グラフ表現に変換するとともに、原子ごとの特徴ベクトルを付加してフィーチャリングを行う。それを物性値とともにGCNに入力し、学習させる。GCN内部は、グラフ畳み込み層、グラフプーリング層、グラフ集約層、出力層から構成されており、機械学習のためのライブラリーとして、スタンフォード大学などで開発された“DeepChem”を使用したという。

 現在のところ、学習用のデータファイルはExcelで準備し、CSV形式で読み込むようになっている。学習対象の物性値(目的変数)は、複数指定して学習させることも可能。また、グラフ化しフィーチャリングした学習用データセットは、深層学習に共通の前処理を経ているため、GCN以外の方法で深層学習にかけることもできるという。今回は、学習済みモデルとして、「密度」「ガラス転移温度」「特性比」の三つを用意しているが、ここに手持ちのデータを追加して再度学習させることも可能となっている。

 最新版のJ-OCTA 5.0は、複数の分子構造(SMILES形式)をもとに分子動力学計算用のインプットファイル(力場パラメーター取得済みのバルク構造)を作成し、物性計算を大量に実行する機能を持っている。この計算結果をデータベースに保存し、機械学習にすぐに利用できるようにする計画もあるようだ。データ数が少ない場合への対応や、ポリマー構造を学習させる方法などの検討も進める。

 また、昨年のユーザーフォーラムで発表された事例では、慶應義塾大学の泰岡顕治教授との共同研究として、短時間のシミュレーションデータを用いて長時間のデータを再現するために機械学習を活用する手法を開発中。分子動力学計算時間を10分の1に短縮する効果があるとしており、機械学習の応用を積極的に広げていく方針である。

******

<関連リンク>:

JSOL(J-OCTA 製品紹介ページ)
https://www.jsol-cae.com/product/material/jocta/


ニュースファイルのトップに戻る