2021年夏CCS特集:長瀬産業
MIで新材料探索を実現、特許・文書から知識体系構築
2021.06.29−長瀬産業は、米IBMと共同開発したマテリアルズ・インフォマティクス(MI)支援サービス「TABRASA」(タブラサ)を昨年11月に製品化し、提供開始している。すでに100社以上の顧客からの反響があり、複数社が実際に評価中。IBMとの研究開発は続行されており、順次新しい機能を盛り込んでいく計画だ。
同社は、2017年1月からIBM基礎研究コンソーシアムに2年間参画し、アクセラレーテッドマテリアルズディスカバリーのプロジェクトをいくつかの日本企業らと共同で実施。その後、IBMとの2年間の共同開発を経て、製品化にこぎ着けた。商社である長瀬産業がこの事業に取り組むことは、幅広いネットワークを持つ強みを生かすことができるとともに、将来的にはMIで開発された新しい物質・材料を商材として流通させることにもつながる可能性がある。
さて、今回のTABRASAは、新材料探索プラットフォームをSaaS(サービスとしてのソフトウエア)形式で利用できるようにするもの。機能は大きく2つで、望ましい機能や特性を持つ材料の分子構造を逆問題的に予測する「アナリティクス・アプローチ」と、特許や論文などを自然言語処理(NLP)で学習し、ナレッジグラフ技術によって知識体系を構築する「コグニティブ・アプローチ」に分かれている。
コグニティブ・アプローチの威力を示した事例がIBMの人工知能(AI)である「Watson」を使用した東京大学医科学研究所の事例(2016年)で、2,000万件以上の医学論文を読み込み、人間の医師が気づかなかった治療法を提案、白血病患者の命を救ったというもの。専門領域の知識を学習させれば、現在のAIは人間の専門家以上の能力を発揮するともいえる。また、ナレッジグラフは異なる領域の知識を掛け合わせることも可能であり、生物とエレクトロニクスの知識を統合することでバイオミメティクス(生物模倣)などの分野でも興味深い発見が期待できるのではないかという。
コグニティブ・アプローチでは、文書から構造化データを取り出し、体系化された知識として関連付けて蓄積することが可能。ユーザーの専門分野や目的に応じて学習させることができ、社内の技術文書などを加えることにより新しい発見につなげることもできる。社内に蓄積された知識をまとめ上げることで、技術の継承にも役立つとしている。現在、IBMとインファレンス(推論)モデルを共同開発中。基本的に、コグニティブ・アプローチは学習した論文などの知識の中から回答を提示するが、推論モデルはまったく新しい回答を示すことも可能になる。
ただ、TABRASAに学習させるデータはユーザーが用意する必要がある。アナリティクス・アプローチの場合は構造式と物性値をひも付けたデータセット、コグニティブ・アプローチでは特許や論文などの文書データ(英語か日本語)が必要になる。データの準備や実際の学習は同社がサポートを行う。実際にプロジェクト推進する際にはデータ不足が問題になることもあるため、将来的には大学・研究機関と提携して、TABRASA上にデータを用意することも検討中。まさに、TABRASAがプラットフォームになり、データコンテンツが流通する場になれば、巨大な事業に発展する可能性もあるだろう。