2022年夏CCS特集:総論 市場動向
統合化・自動化されたR&D未来図現出へ、2021年度二ケタ成長559億円規模に
2022.06.28−コンピューターケミストリーシステム(CCS)は、医薬品や物質・材料の性能・機能を高度化し、迅速に開発を進めるための自動化システムとして大きな発展を遂げつつある。「データに導かれた研究」という大きな流れが根底にあり、実験・測定によって得られたデータをデジタル化して集める計測インフォマティクス、物質・材料を合成あるいは製造する際の反応条件や組成・製法を探るプロセスインフォマティクスなど、周辺の技術開発も進んだ。これにより、望ましい機能や特性を持つ物質を設計し、それを実際に合成・製造し、できあがった物質を分析・測定し、得られたデータを解析して新たな気づきを得るという研究開発プロセス全体の統合化を達成することが可能。しかも、統合化だけではなく、そのすべてを自動化するという未来図がいままさに描かれつつある。
◇ ◇ ◇
◆◆リモートでセミナー等活発、動画活用も進展◆◆
CCSは、化学物質に関する研究開発を支援するためのIT(情報技術)ソリューションで、計算化学に基づく分子レベルのモデリング&シミュレーション、実験データを含めて研究に必要な各種情報を管理する基盤となるインフォマティクス/電子実験ノート、生命情報を解析して知見を引き出すバイオインフォマティクス、特許や学術文献などにアクセスするデータベースサービスなど、さまざまなシステムが利用されている。また、クラウドの普及にともない、これらのシステムを稼働させるためのホスティングサービスも浸透。なかでも、モデリング&シミュレーションは計算量が増大してきているため、クラウドの計算機資源を借用するケースが多くなってきている。
こうしたCCS関連の各種ソリューションを開発・販売している国内主要ベンダーの売り上げの推移をもとにした2021年度の市場規模は、CCSnews調べで約559億円。前年度に対して11.7%ほどの伸びがあったとみられる。新型コロナウイルス感染症の社会的な影響はまだ続いているものの、リモートによる活動が一般化したことで、ベンダーの事業活動に対する影響はほとんどなくなってきている。コロナ禍での制限がはじまった2020年はセミナーやユーザー会などのイベントはほぼ中止となり、学会や展示会もなくなったことでプロモーション機会が消失し、それなりの影響が出た。しかし、2021年はほとんどのベンダーがリモートでユーザー会を再開。製品アピールの機会を兼ねたセミナー開催は、コロナ以前よりもむしろ活発になった印象だ。時間も、1時間や2時間などのコンパクトなものが増え、ユーザーの負担が減って参加しやすくなったことは、確実にリモートのメリットだといえる。
動画を有効に活用するベンダーも増えた。ユーザー会や製品紹介セミナーの映像をのちほど配信すれば、当日参加できなかったユーザーも益が得られる。また、製品トレーニングの動画をライブラリー化することにより、ユーザーはいつでも好きなときに視聴し、セルフサービスで学習することが可能。決まった日時に会場へ出かける時間や経費を考えると、ユーザーにとっても好都合だ。もちろん、リモート環境においてライブで対話的にトレーニングすることも技術的には可能であり、これらの方法を組み合わせることで、各ベンダーのユーザーサポートはかなり充実が図られたと考えることができるだろう。
ただ、ベンダーの事業活動が正常化し、リモートを駆使したスタイルが効果を発揮しただけで、昨年度の市場拡大が達成されたわけではない。コロナ禍の日本経済において、デジタルトランスフォーメーション(DX)が大きく注目されたことが最も大きな要因だろう。すなわち、研究開発DXとして、旧来の試行錯誤的な研究からデータ主導型への転換という大きな流れが根底にあり、それにともなってCCSへの投資が活発化したといえる。
◇ ◇ ◇
◆◆研究開発DXでMIに注目、計算化学で学習データ創出◆◆
別掲のグラフに、ここ30年間のCCS市場推移を掲げた。いわゆるリーマンショック以降は一貫した成長曲線だが、2ケタ増という年はほとんどない。「急激に伸びる市場ではない」と認識しているベンダーが多かったと思われる。その意味では、昨年度の大きな成長の原動力はDXであり、とくにマテリアルズ・インフォマティクス(MI)がその重要な要素になるとして注目されたためだ。それ以前にも、人工知能(AI)創薬の取り組みが進められたが、機械学習にデータを使用するものの、研究プロセスそのものをデータ主導に革新しようという認識はそれほどなかったように思われる。それに、創薬よりも材料研究の方が裾野が広く、関連する素材企業が多いこと、日本経済の支柱である自動車や電気産業を最終用途としていることも大きな要素だろう。
DXブームが勃興する時期にちょうど重なって、国の主要MIプロジェクトが一周し、MIとプロセスインフォマティクスや計測インフォマティクスを含めて、研究開発全体をデータ主導で統合化・自動化しようというコンセプトが立ち上がってきた。それを機に、DXとデータサイエンスが一体となった「研究開発DX」という戦略が一気に広まったということができるだろう。
また、本特集のインタビューで、これからのMIの訴求点として、「サステナビリティへの寄与」を取り上げたベンダーがいくつかあったことも注目に値する。昨年まではこうした見方はまったくなかった。確かに、MIによって試行錯誤的な実験が大幅に削減されるため、資源をムダにしないという意味でサステナブルである。MIで開発しようとしている材料の多くは、サステナビリティ等のニーズをターゲットにしたものだ。AI創薬では、機械学習による毒性予測などが行われてきたが、これも動物実験を代替するという意味でSDGsの取り組みに関係してくる。こうしたポイントをうまく刺激することで、企業の投資意欲をさらに高めることができるかもしれない。
さて、具体的に昨年度に伸びた製品ジャンルはデータ基盤づくりに関係するもので、電子実験ノートへの引き合いは依然おう盛だとみられるほか、実験・計測機器と連携し、データを自動的に吸い上げて蓄積するソリューションが注目された。また、蓄積したデータを活用するための仕組みやデータ解析ツール、研究コラボレーションのためのツールやサービス提供などにもユーザーの関心が集まった。
実際に、MIやAI創薬を実施するに当たっては、まだまだ専門家の助けが必要なため、個別に受託研究スタイルでサービス提供する専門的なAIベンダーも多くある。化学・材料メーカーの裾野が広いことや、自動車や電気などの材料ユーザーが材料研究に注目する傾向も強くなっているため、こうしたサービスに対する需要がさらに拡大していることは間違いない。AIベンダーの数が多いためはっきりとした数字はないが、少なくとも20〜30億円ほどの市場規模になっていると思われる。
さらに、データ主導型MIに関連して、昨年度に伸びたのが計算化学/シミュレーションの分野だ。MIを推進するためにまず社内の研究データをかき集めようとしたが、医薬分子と異なって、材料は組成や形態がまちまちであり、例えば全部を表にして並べたときにあちらこちらにデータが欠損している部分が生じる。実験装置や実験条件もさまざまであり、機械学習の教師データとして整えられたデータセットにすることは難しかった。そこで、計算化学を利用する戦略が注目されたのである。計算値をデータとして、材料の機能・特性との相関を学習しようというわけだ。電子を取り扱える第一原理計算/量子化学計算を使って解析すれば、実用的な物性に関連のある計算値を求めることができる。または、電子状態を考慮できる第一原理分子動力学計算を用いて、各種の計算データが創出され、機械学習に利用されている。現時点では、この戦略は非常に有効だと考えられており、昨年度もこの用途でモデリング&シミュレーションの需要は大きく成長した。
この分野では、さまざまな計算条件でできるだけ多くの計算を実施する必要があるため、ベンダー側もそうしたニーズに対応する取り組みを進めている。主にリアル世界で得られたデータを管理していたインフォマティクス基盤に、シミュレーションシステムを接続する動きも出てきている。
とくに、MIでは新規な材料を対象にするため、経験的な力場を使わない第一原理計算が有効。しかし、これは計算が重いため、大規模な計算機環境が必要であり、ある場合は「富岳」のようなスーパーコンピューターで実行するような世界になってしまう。一企業が社内に設置することが難しいこともあるため、外部の計算センターをクラウドで使用するケースが増えている。こうしたサービスはかなり前からあったが、ここへ来て引き合いが具体的になってきているようだ。
ただ、スパコンを使ったとしても計算負荷は高い。そのため、分子力場を機械学習で生成するニューラルネットワーク力場への注目が急激に高まってきた。第一原理計算結果を学習させ、それを再現できるようにポテンシャルエネルギーの力場を調整する。この力場を使った計算は、実際には分子動力学計算であるため、第一原理計算と同じ結果が得られても、計算コストは格段に低い。また、経験的な力場がない系でも計算できるため、新規性の高い物質を対象にしたいMIの用途にもかなっている。しかしながら、教師データとして、どのような構造についてどれほどの数の計算結果を用意するべきか、はっきりとはわかっていない。あまり多くの第一原理計算を行うとなると、第一原理計算を減らしたいというそもそもの目的と反してしまう。力場の精度を担保した機械学習を行うこと自体がそもそも専門的で難しいという問題もあるが、最近になって実際に利用できるニューラルネットワーク力場が生み出されつつある。今回のCCS特集でも、いくつかのベンダーがそうしたソリューションを提供しているので注目してほしい。