2021年夏CCS特集:総論 市場動向
AI統合でラボのデジタル基盤化推進、2020年度市場規模493億円/4.1%増
2021.06.29−コンピューターケミストリーシステム(CCS)は、創薬分子設計や材料開発にともなう各種情報の登録・参照、計算化学を中心にしたモデリング&シミュレーションとして普及したが、近年は研究開発全体を支える情報基盤(プラットフォーム)としての役割がクローズアップされてきている。ラボのデジタルトランスフォーメーション(DX)を実現し、さまざまな機能がビルトインされた統合ソリューションとして発展中。外部のシステムやサービスとシームレスに連携できる柔軟性・拡張性も重視されている。とりわけ、プラットフォームへの統合が期待されているのが人工知能(AI)関連の技術で、蓄積したデータで機械学習を行い、AIモデルを構築し、研究に活用することが焦点になっている。生命科学領域ではAI創薬、材料科学領域ではマテリアルズ・インフォマティクス(MI)というかたちで注目されており、産官学をあげて大がかりな取り組みが行われるほどの一大ブームを形成している。
◇ ◇ ◇
◆◆コロナ禍でELN導入活発、計算化学と機械学習が連携◆◆
CCSは、物質・材料に関する研究を支援する目的で開発されたITソリューションで、計算化学に基づくモデリング&シミュレーション、研究情報や実験データを管理するケムインフォマティクス/電子実験ノート(ELN)、生命情報を解析するバイオインフォマティクス、特許や科学技術文献などを調査するためのデータベース(DB)サービスなど、さまざまなシステムが利用されている。
こうしたCCS関連の各種ソリューションを開発・販売している国内主要ベンダーの売り上げの推移をもとにした2020年度の市場規模は、CCSnews調べで約493億円。前年度に対して4.1%成長したとみられる。ELNの導入が活発化し、好調だった2019年度に比べて、伸び率は下がったが、コロナ禍のなかで比較的堅調に推移したといえるだろう。とくに、昨年4月から5月にかけて緊急事態宣言が発出された際は、顧客である企業や大学の研究所・研究室に入れない、外部とのウェブ会議が許可されていない企業があるなど、事業活動が停滞し、一時はかなりの危機感があった。
ところが、各ベンダーの昨年度の売り上げを調べると、影響のあったベンダーは一部であり、好調さを維持したところが多かった。ここ数年、取り組みが進んでいた働き方改革がコロナ禍で加速し、デジタル化による業務改革を促進するDXブームが到来。研究開発やラボ業務のDX化につながるということで、ELNなどのインフォマティクス系CCSへの需要がさらに拡大した印象である。とくに、有機合成や分析・計測などの実験データをELNに集め、研究開発プロセスに横串を通すデータ基盤にしようという考え方が広がってきている。導入の検討から構築まで数年かかることが通例であるため、コロナ以前からプロジェクトがスタートしており、コロナ禍でも投資に遅れがなかったケースが多かったようで、ELNをはじめとするインフォマティクス系ベンダーの中には売り上げが10〜30%伸びたところもあった。
また、リモート環境で研究活動を行えるようにするコラボレーションツールにも注目が集まった。これは、アカデミックや受託パートナーなどの外部機関と連携するオープンイノベーション型の研究環境を支援するためのシステムで、クラウドをベースに国や地域にとらわれずに情報共有や意見交換をすることが可能。これが、コロナ禍のデジタルラボのスタイルにぴったりとはまった。データのハブにもなるという意味でELNと似通ったイメージはあるが、こちらはコラボレーションを重視した機能がメインで、物性計算などの解析ツールとの連携も考慮されているものが多い。仮想現実(VR)空間でコラボレーションするという製品もある。
加えて、昨年好調だったのが材料系のモデリング&シミュレーションだ。これは、MIへの関心の高まりが背景にある。AI創薬とMIを比べると、データが揃っているかどうかで格段の差があるといわれるように、MIに取り組むとまずデータがないという問題に突き当たるのである。創薬研究は企業内に化学構造や各種物性値のDBが整備され、外部の化合物ライブラリーも大量にあり、機械学習のネタに困ることはあまりない。それに対し、材料分野は研究データを体系的に残していくという意識が薄く、DBの蓄積も少なかった。データがあっても個人的に記録されており、それらを全部集めても測定条件やデータ項目が揃っておらず、そのまますぐに機械学習を行うことはできない。
そこで、計算化学によるシミュレーション結果を機械学習用のデータとして蓄積しようという戦略があらわれた。材料系シミュレーションの機能はここ数年で大きく向上しており、第一原理計算や分子動力学計算などを利用して、実際の材料特性に結びつく物理量の計算が可能になってきている。大量の計算を自動的・連続的に処理する仕組みを備えたシステムもあり、学習用のデータを生成する目的で注目された。材料系のシミュレーションベンダーは、昨年度の売り上げが2ケタ増だったというところも多い。
◇ ◇ ◇
◆◆AIブームが技術革新を牽引、データを保護して共同学習◆◆
このようなCCS市場の成長分野の背景には、AIブームの影響があるだろう。深層学習(ディープラーニング)が注目され、第3次AIブームといわれてすでに10年以上たつが、まったく衰えがみえないどころか、ここへ来てIT産業のトレンド自体が完全にAI主導となっている。例えば、今年から本格的に稼働(共用開始)したスーパーコンピューター「富岳」は、本来の科学技術計算に加え、機械学習にも適したデザインが採用されている。近年では、機械学習を高速化するためにGPUが多用されているが、汎用のマイクロプロセッサーを手がけるインテルも、最新チップには機械学習/深層学習に対応した機能を組み込んでいる。進歩の原動力はまさにAIだ。
大量のデータに対して複雑な機械学習を行うために、「富岳」に代表されるようなスーパーコンピューターが今後も必要だとされている。将来的には量子コンピューターの活用も視野に入っているほど、計算パワーの要求には際限がないと思われる。AIが最高の処理速度を求めるかぎり、IT産業のトレンドはこれからもAIに支配されることになるだろう。
そうしたなか、データの質を高め量を増やすために企業の枠を越えた取り組みが始まっている。AI創薬では企業内にある程度のデータ蓄積があることは事実だが、1社だけのデータでは世界と戦えないという認識が広がってきたためだ。門外不出だった自社データを他社と共有し合い、全体のデータで機械学習してAIの能力を飛躍的に高めようとしている。
そこで注目されているのが“コンフィデンシャルコンピューティング”と呼ばれる技術だ。これにより、コンピューターのメモリー上でいままさに処理されているデータを暗号化して守ることができる。そもそも、データが記憶媒体上に保存されている際や、データが取り出されたあとの転送時は暗号化によって保護できているが、メモリー上で処理されている時まで暗号化していることは難しかった。この問題を解決し、データのライフサイクル全体にわたって暗号化で保護できるのがコンフィデンシャルコンピューティングで、本来はセキュリティ技術だが、機械学習に当たっても有効。独立したデータ所有者の間で、データや知的財産の機密性を保ちつつ、モデルのトレーニングを共同で行うことができるのである。この機能は最新のマイクロプロセッサーに組み込まれており、すでに利用することが可能だ。
このような取り組みはAI創薬で先行しているが、ニーズはMIでも共通であり、さらに動きが広がっていくかもしれない。それと同時に、データ自体の流通市場が形成される可能性もある。すでにDBサービスベンダーは、ユーザーの要望に応えるかたちで、データそのものをまとめて提供したり、ユーザーアプリケーションからDBに直接接続させたりするAPI(アプリケーションプログラミングインターフェース)機能を提供し始めている。それだけではなく、広くデータを集めるプラットフォーマーとしての事業者が登場し、データが流通するようになる未来を予見する専門家もいる。創薬データや材料データにそれほどの価値があるならば、社内のデータそのものをビジネスにしようという企業が出てきてもおかしくはないというわけだ。
さて、多くのユーザー企業がAIへの取り組みを志向するなかで、それを支援しようというベンダーもあらわれてきている。大手のITベンダーが取り組む例もあるが、スタートアップのベンチャーも数が多い。米国にはAI創薬に特化したスタートアップが数百も出現しているといわれているが、日本でも旗揚げする企業が増えている。MIをターゲットにしたベンチャーが多いのが日本市場の特徴だろう。
これらの企業のビジネスモデルは、受託研究/共同研究のスタイルが主流だ。これまでのCCSベンダーのようにパッケージソフトの販売・サポートで事業を進めるケースはほとんどない。これは、AI創薬にしてもMIにしても、現時点ではすぐに使えるパッケージとしてツールを提供することが難しいという事情があるためだ。ほとんどの場合、ユーザーの目的や要求に応じて、データを用意することから、機械学習を行い、AIモデルを構築するところまで、すべてが個別対応になるからである。企業数も多いためはっきりとした数字はないが、現時点で少なくとも20億円程度の市場規模になっていると思われる。
ただ、受託タイプのビジネスは安定感に欠けることが課題だろう。案件を獲得すれば売り上げは伸びるが、そのプロジェクトが終了してしまったり、新しい案件を獲得できなかったりすると、その年は売り上げが落ちてしまう。現在はブームで案件は豊富にあるという考え方もできるが、先を見越して事業の多角化を図るベンダーも出てきている。パッケージに近いかたちでソフトウエアを製品化し、利用にともなうライセンス収入を安定的に得ようという作戦が多い。
過去を振り返ると、2000年をまたいでバイオインフォマティクスブームがあり、政府関係の助成金も大量に投入されて、市場が一気に盛り上がったことがあった。しかし、助成金の投入も3〜5年で終了。その後、バイオ関係のDBやソフトはほとんどがオープン化してしまい、ビジネスとしてのうまみが消失して、市場が一気にしぼんだ例がある。これを繰り返すことはないと期待したいが、AI創薬/MIビジネスの市場性にも引き続き注意を払うべきだろう。