2018年夏CCS特集:総論 市場動向

AI/機械学習で高まるインフォマティクス需要

 2018.06.20−コンピューターケミストリーシステム(CCS)市場が好調だ。創薬研究に代表される生命科学分野と、高度な特性を持つ機能材料の開発を目指す材料科学分野に大きく分けることができるが、人工知能(AI)/機械学習ブームの盛り上がりを背景に、インフォマティクス系のシステムへの需要が拡大している。AI創薬やマテリアルズインフォマティクス(MI)といったキーワードが注目を集めており、先行的な研究の中から成功例も聞かれるようになってきた。ただ、科学研究にAIを持ち込むことはまだまだ多くの課題を抱えており、まずは機械学習に利用できるデジタルデータとはどういうものか、それをいかにして集めるかが当面のポイントになってきている。とりわけ、電子実験ノート(ELN)への関心が高まっている。

                    ◇       ◇       ◇

◆◆2017年度市場規模443億円/6.8%増、ELNなど好調持続◆◆

 CCSは、医薬・化学・材料分野の研究開発を支援するためのIT(情報技術)ソリューションで、計算化学に基づくモデリング&シミュレーション(M&S)、研究情報を管理するケムインフォマティクス/電子実験ノート(ELN)、生命情報を解析するバイオインフォマティクス、特許や文献などを調査するためのデータベース(DB)サービスなど、さまざまなシステムが発達している。

 こうしたCCS関連の各種ソリューションを開発・販売している国内の主要ベンダーの売り上げの推移をもとにした2017年度の市場規模は、CCSnews調べで約443億円。前年度に対して6.8%成長したとみられる。日本経済が堅調で、企業の業績も比較的好調だったこともあり、研究開発に向けたIT投資が活発だったと考えられる。とくに目立ったのがインフォマティクスソリューションへのニーズである。

 別図のCCS市場推移をみると、2000年から2003年にかけたピークはいわゆるバイオブームで、ゲノムやプロテオーム解析に国プロジェクトなどで巨額の予算が投入された期間だ。その後、ここ数年の成長は、製薬業におけるELN導入、情報系システムの更新、さらに材料科学系M&Sの伸びに牽引されてきた。2017年度は、バイオブームのピークだった2003年度の市場規模を上回ったと推定される。

 その大きな要因は、ELNおよび材料系M&Sが引き続き好調を持続していることだが、その根底にはAI/機械学習への取り組みを進める目的でインフォマティクスソリューションへのニーズが高まった事実がある。もともと、AIとCCSに深いかかわりがあったことはあまり知られていない。AIの第1次ブームとされる1960年代において、世界初のエキスパートシステム(ES)といわれたのが、1965年にスタンフォード大学のリーダーバーグ博士が開発した「DENDRAL」。赤外スペクトルから化学構造を推定する機能を持っていたとされる。

 第2次AIブームといわれる1980年代はESの全盛期で、CCS分野においては有機合成経路設計での逆合成解析などが試みられた。1990年代に入るとニューラルネットワークが登場し、スペクトルと構造の相関解析、タンパク質の2次構造の予測、構造活性相関解析、化学反応過程の予測などに利用された。

 これに対し、現在の第3次ブームにおけるAIの大きな違いは、学習に大量のデータを必要とすることだろう。創薬研究分野は1970〜1980年代から化合物DBの構築や実験データの管理が行われてきており、近年はELNによるインフォマティクスのプラットホーム化が実現。一方で2000年代以降バイオ系DBの整備が進んだことで、これらのデータを利用したAI創薬への取り組みがはじまっている。

 とくに、機械学習を用いた物性予測・毒性予測などが試みられているが、これは構造活性相関(SAR)解析として、既存のCCSで行われてきたことと用途は同じだ。そこで、統計学的なモデルとAI的なモデルとの予測結果の差異を比較する目的で、SAR関連のモデリングソフトへのニーズがあらためて高まっている。既存ソフトにも伝統的な機械学習の手法が搭載されているため、最新で大量のデータを使ってモデル化をやり直そうという動きもある。

 既存のCCS製品は商用ソフトなのでベンダーのサポートがあるが、最近のAIツールはオープンソースが大半なので、使いこなすための敷居は高い。AI系ベンダーの助けを得ながら進めるケースが多いだろう。

 こうしたことに加え、昨年度の生命科学系市場はELNへの需要が堅調に推移したことも特筆される。先行して導入したユーザーがここ数年でシステム更新期を迎えているほか、利用分野が化学系(有機合成)から生物系、分析系へと広がっていることも大きい。また、クラウド型ELNへの関心も高まっている。これは、オンプレミスのELNの運用をクラウドに移行するケースと、最初からクラウドがメインのELNを導入するケースに分けられる。オンプレミスとクラウドが選べるベンダーでも、過半数がクラウドになっているのが最近の状況である。

                    ◇       ◇       ◇

◆◆MI利用で続々と成果、因果推論の理解カギに◆◆

 他方、材料研究分野はそれなりのDBの蓄積はあるものの、企業内では体系的にデータが整備されておらず、個人のPC内にため込まれている場合が多いといわれる。材料研究は実験主導の試行錯誤的なやり方が主体であるため、そうした状況が長年問題視されることはなかったが、ここ数年でMIが注目を浴びたことで変化が生じた。MIは、材料に関するデータを集めてそこから新たな知識を抽出し、目的の機能や物性を持つ材料を狙い撃ちで設計しようというもの。望ましい組成や構造を提示できるAIを構築することが大きな目標となっている。

 このため、製薬業向けに普及したELNがこの分野でも注目されつつある。データを集めて整え、適切に管理するうえで、ELNのフレームワークは材料研究にも有効であり、ベンダーの話によると、昨年度は実際にかなりの引き合いがあったようだ。ELN需要は、クラウド型も含めてこの先も高まっていくと予想される。

 また、材料分野では機械学習を行うためのデータが不足しているという問題もある。これを補う意味で、量子化学計算/第一原理計算による計算値を学習に利用する方法が提起されている。昨年度は材料系M&Sの需要が好調だったが、MIに関連する需要も相当数あったと予想される。計算機の高速化や計算手法の進歩で、実際の材料特性に結びつくレベルのシミュレーションが可能になってきたことも重要な要素だ。

 MIは、文部科学省プロジェクト「情報統合型物質・材料開発イニシアティブ」(MI2I)と経済産業省プロジェクト「超先端材料超高速開発基盤技術プロジェクト」(超々PJ)が実施されたことで、産業界の関心に火がついており、すでに一定の成果も公表されつつある。昨年の高分子学会で特別セッションで取り上げられたほか、この1年間で専門紙等に掲載された記事としても、「ファインセラミックスセンターが高安定性・高イオン伝導体を開発」(昨年5月)、「日立製作所がモーターの小型化に役立つ新型磁石を開発」(昨年6月)、「旭化成が樹脂コンパウンドやアクリロニトリル用の触媒開発で成果」(昨年10月)、「東工大と東北大が室温で強誘電性示すガリウム鉄酸化物開発」(昨年12月)、「日揮触媒化成が高活性FCC触媒の設計に適用」(今年1月)、「ファインセラミックスセンターが高誘電率材料を設計」(今年3月)、「キシダ化学が次世代電解液の開発を加速」(今年5月)など、いくつかの事例が定期的に報じられている。

 ただ、現在のAIは、耐熱性を上げるなど既知の物質の機能を最適化することには適用できるが、まったくの新奇物質の発見にはつながらないとする指摘がある。AIはデータの中の相関関係をあぶり出すもので、因果関係を解明するものではないからだ。例えば、身長と体重の間に相関関係があることは明らかで、身長が高ければ体重も大きい。しかし、両者に因果関係はないので、体重を増やしたからといって身長が高くなるものではない。

 AIによる推論はブラックボックスだとよくいわれる。最強囲碁AI「アルファ碁」を汎用化した最新の「アルファゼロ」は、AI同士が勝手に対戦することにより、わずか2時間の学習で最強の将棋AIに、4時間で最強のチェスAIに、そして8時間で以前のアルファ碁に勝つまでに成長したが、何を学習しているのか人間にはもはや理解不能だという。

 理屈はわからなくても結果だけ合っていればいいという世界もあるが、「原理や法則がわからなくては科学的とはいえない」という意見にもうなずかざるを得ない。すでにこうした議論ははじまっており、米国では「理解できるAI」の開発プロジェクトも進んでいるという。また、相関解析と因果推論の橋渡しをすることがMIの役割であるという考え方も出てきている。

 いずれにしても現在、AIに特化したCCS製品を提供するベンダーはほとんどない。第2次AIブームの時は、AIの構築ツールもアプリケーションも商品として販売されたため、購入すればベンダーのサポートも受けられ、一定に利用することはやさしかったが、現在の主要なAIツールはほぼオープンソースで占められている。AI技術に優れたスタートアップ企業は山のようにあるが、彼らには創薬・材料研究の知識はないため、AIを利用したいユーザーは多くの場合プロジェクトベースでAI構築を進めなければならない。買ってきてすぐ使えるというものではなく、ユーザー・ベンダーともにしばらくは模索の時が続きそうだ。


ニュースファイルのトップに戻る