産総研と東大生研のグループが新たな深層学習技術

学習モデル内部に密度汎関数理論組み込み、未知化合物に対する外挿予測

 2020.11.12−産業技術総合研究所 人工知能研究センター 機械学習研究チームの麻生英樹チーム長と椿真史研究員、東京大学生産技術研究所の溝口照康教授の研究グループは11日、密度汎関数理論に基づく深層学習技術を開発し、学習データに含まれない新規物質の物性予測を高精度に行うことを可能にしたと発表した。波動関数や電子密度という量子物理的に最も基本的な情報を利用しているため、材料開発や創薬分野における大規模な有用物質探索に幅広く貢献できると期待される。

 近年、化合物のさまざまな物性値(物質のエネルギー、触媒の反応収率、発電材料の効率、薬剤の活性など)を量子力学で計算・予測するニーズが高まっているが、膨大な計算コストが必要になるため、深層学習による物性予測で計算量を削減する試みが注目を集めている。ただ、深層学習の中身はブラックボックスであり、材料開発や創薬の分野で重要な解釈性・信頼性が低いことが問題になっている。また、人工知能(AI)は一般に、存在するデータから答えを導く内挿は得意だが、存在しないデータを推測して答えを導く外挿は不得意であり、学習に利用した化合物群と大きく分子構造が異なるような物質に対しては、著しく予測精度が悪くなることがあるという。

 今回、産総研のグループは化合物の物性予測について、高い解釈性・信頼性を持つ深層学習技術の研究に取り組んできており、東京大学生産技術研究所では機械学習を材料開発に利用するマテリアルズ・インフォマティクス(MI)に関する研究を行い、その一環で界面構造を高速に決定する手法や、スペクトルから物性を予測する手法の開発を進めてきていた。

 今回の研究では、密度汎関数理論に基づいて計算した波動関数と電子密度を組み込んだモデルを構築し、化合物の原子配置(入力)と物性値(出力)に関する大規模データベースを用いて学習させた。これにより、データの偏りに影響されない普遍的な情報である波動関数と電子密度を経由して、物性値の予測(外挿予測)が可能になったことがポイント。具体的には、分子の波動関数から物性値を予測するニューラルネットワークと、電子密度にポテンシャルの制約(ホーヘンベルグ・コーンの定理)を課すニューラルネットワークの2つを交互に学習させた。(別図参照)

 検証として、密度汎関数法で波動関数から計算した電子密度の値と、ニューラルネットワークで予測した電子密度とを比較したところ、1〜3kcal/molの誤差で予測できた。理論計算には実験値と比較して1〜2kcal/molの誤差が含まれているとされるため、今回の技術による外挿予測は総合すると2〜5kcal/molの誤差であると考えられる。これは、十分に実用に耐えうる精度だという。とくに、理論計算では1つの分子に数十分から数時間が必要だが、今回の技術は数分で1万個の分子の物性を予測できる。つまり、実用的な外挿精度を保ちながら、10万倍以上の高速化が可能ということになる。とりわけ、波動関数と電子密度を深層学習モデルの内部で表現・経由しているため、深層学習モデルのブラックボックス性が解消され、材料開発や創薬研究に応用する際の解釈性・信頼性が向上する意味が大きいとしている。

 なお、今回の研究成果は、アメリカ物理学会が発行する「Physical Review Letters」誌に、「Quantum deep field: Data-driven wave function, electron density generation, and energy prediction and extrapolation with machine learning」のタイトルで発表された。

******

<関連リンク>:

産業技術総合研究所(人工知能研究センター機械学習研究チームのページ)
https://www.airc.aist.go.jp/mlrt/

東京大学生産技術研究所(溝口研究室のトップページ)
http://www.edge.iis.u-tokyo.ac.jp/


ニュースファイルのトップに戻る