TSテクノロジーがMI向け受託研究サービス
学習データセット構築からAIモデル作成まで、計算化学を駆使
2019.12.28−山口大学発ベンチャーのTSテクノロジーは、このほどマテリアルズ・インフォマティクス(MI)を対象にした受託研究サービスを提供開始した。機械学習のためのデータセットを計算化学で創出したり、実際に機械学習を実施して人工知能(AI)モデルを構築したり、ニーズに合わせて要望に応える。山口大学との共同研究など、産学連携で培った技術力を強みにしていく。
同社は今月、山口本社(山口県宇部市)の本社機能の一部を移転し、東京本社(東京都千代田区)を正式に開設。合わせて、山口大学などと連携して計算化学およびMI研究開発を行う「機能材料開発センター」を山口本社内に設置した。新しい東京本社内にもGPGPUを含むサーバー環境を増強し、受託計算/受託研究ビジネスを拡大させていく。
今回のMI向けサービスは、同社がこれまでに手がけた技術領域のノウハウを集めたもので、「人工知能のための計算化学データセット構築サービス」と「回帰分析・機械学習解析サービス」から構成される。まず、前者では、分子における電子の振る舞いを計算することにより、精密な電子的物性算出や反応解析などを実現する量子化学(QM)計算と、分子集合体としてのバルクな物性や熱的挙動を計算できる分子動力学(MD)計算の両方を利用し、素材を構成する各要素分子に対する構造記述子計算を含め、AIモデル開発のための学習データセットを用意する。構造記述子としては、0Dおよび1D、2D、3Dディスクリプター、フィンガープリント、分子量、部分電荷、芳香族性など、計算化学で導く物性値として、エネルギー、エントロピー、振動数、励起波長、HOMO/LUMO、電荷、双極子/多極子、NMRシフト値などが利用できる。
また、後者のサービスでは、データのクレンジング、学習データの追加作成、ハイパーパラメーターの最適化などを一貫して行い、機械学習を含む最適な回帰分析モデルの選択により、予測精度の高いモデル構築を実際に行う。対応可能な手法として、重回帰分析、主成分分析、PLS解析、QPLS解析、自己組織化マップ(SOM)、ニューラルネットワーク、サポートベクターマシン(SVM)、ランダムフォレスト、畳み込みニューラルネットワーク(CNN)、グラフ畳み込みニューラルネットワーク(GCNN)などがある。
同社は、山口大学の研究拠点群形成プロジェクト「深層学習の予測に基づいた新規機能性化合物創成と検証」に参画して、色素増感太陽電池材料の探索をテーマに、深層学習によって分子構造や構造記述子から増感性を予測するモデルを構築したなどの研究実績を持つ。具体的には、増感性の実測値を有するポルフィリン系色素などのデータセットを用いて、分子の構造的な特徴と増感性との相関を調べた。実際に、分子構造から増感性の予測が可能であることを確認したという。
機械学習のためのツールは、オープンソースソフトウエアなどで簡単に入手可能だが、データセットの構築自体が専門的な作業となるほか、機械学習やモデル構築を実際に行うにもかなりの専門的なノウハウが必要。今回のサービスの反響が期待される。
******
<関連リンク>:
TSテクノロジー(トップページ)
http://www.tstcl.jp/ja/