材料研究分野でLLMへの関心高まる
1〜3年以内にブレークスルー、QunaSysがアンケート
2024.10.31−化学・材料研究において、生成AI(人工知能)のコア技術である大規模言語モデル(LLM)への関心が高まっている。量子コンピューター関連のスタートアップであるQunaSysが主催しているコンソーシアム「材料開発LLM勉強会」で、参加者へのアンケートをとった結果、実態や期待のほどが明らかになった。今年9月に終了した第1期活動のまとめでは、材料開発におけるLLM活用が、「1〜3年以内にブレークスルーを起こすユースケースが発見され、爆発的に使用が広がる」と答えた割合が41.2%、「5年後には社内で定着し、材料開発の革新が進む」が35.3%となるなど、参加者は大きな手応えを感じたようだ。
◇ ◇ ◇
第1期コンソーシアムは今年の6〜9月にかけて行われ、大学教員らからのレクチャーや、生成AIが材料開発に適用できるLLMユースケースを探ったり、具体的なプロンプトチューニングを行ったりするなど実際に手を動かす演習も行われた。アンケートは参加者約100人を対象にしたもの。
初期は、LLMの導入・活用における障壁について、「ユースケースは思いつくが、LLMの活用方法・フローがわからない」(24.4%)、「ユースケースが思いつかない、何をすればいいのかわからない」(22.0%)、「セキュリティ面への懸念がある」(19.5%)、「ハルシネーション(間違った情報)生成のリスクが大きい」(12.2%)、「データの構造化が難しい」(9.8%)などとなっていたが、終盤では「LLMがどのように業務や日常に役立つかが具体的に理解できるようになった」(55.0%)、「LLMの可能性に非常に興味を持ち、積極的に学びたいと思うようになった」(25.0%)、「LLMの利点だけでなく、限界や課題についてもより明確に認識するようになった」(15.0%)と意識が変化。LLMや生成AIを実際に使用する行動を起こす人が増えたという。
勉強会の中では、実際にLLM開発ツールのDifyを使用するとともに、生成AIに質問する際のプロンプトのチューニング、外部情報を検索して回答に反映させるRAG(検索拡張生成)の使い方も学んだ。それを踏まえて、LLM活用の難しさとして、「自身の業務フローを細部まで理解し、言語化・可視化すること」(68.2%)、「LLMとコーディングとの特性・差異を理解し、適切に使い分けること」(13.6%)があげられている。また、自社内で活用する際の課題は、「最新のLLMに関する情報をキャッチアップすること」(44.8%)、「LLMに関連する法律や研究倫理を理解・順守すること」(27.6%)という回答が多かった。
具体的なユースケースとしては、高分子の物性予測、新規分子の合成、社内マニュアルや手順書のRAG実装、テクニカルサービスのためのデータ収集と活用−などのアイデアが出された。最終的にLLMについての感想は、「LLMは万能ではないが、適切なユースケースの要因分解と活用場面の設定を行えば有能そう」(52.9%)、「LLMは定量的なものは苦手だが、定性的なことには活用できそう」(29.4%)、「適切なプロンプトチューニングやRAGの構築により、すぐにでも使えそう、使いたい」(11.8%)という結果になった。
QunaSysでは、引き続き10月から第2期のLLM勉強会をスタートしている。先行研究の論文内容を再現する目的で、LLMによる新規分子生成、LLMによるデータ収集・構造化・活用、LLMによる研究開発課題の要因分解・実験計画を行うほか、参加者からテーマを募集し、実装のための要因分解を行って、ユースケースの探索も進めていくことにしている。
*****
<関連リンク>:
QunaSys(トップページ)
https://qunasys.com/
QunaSys(材料開発LLM勉強会の紹介ページ)
https://llm.qunasys.com/