CCS特集2019年夏:総論 市場動向
データ駆動型研究実現へ新たな扉、2018年度市場規模448億円/2.1%増
2019.06.21−コンピューターケミストリーシステム(CCS)は、医薬品や精密化学品・機能材料の研究開発を支援するIT(情報技術)ソリューションとして、すでに欠かせない存在となっている。理論的・合理的に分子設計を行うための計算化学技術が飛躍的に発展しているとともに、研究に必要なさまざまなデータを蓄積し再利用するための情報システムの高度化も目覚ましい。クラウドを通して、計算機資源が手軽に、また容易に拡張できるかたちで入手できるようになってきたことも、高度なシステム利用を促している。人工知能(AI)活用も急ピッチで進展しており、データ駆動型研究を推進するというかたちで、CCSの利活用が新たな時代の扉を開きつつある。
◇ ◇ ◇
化学・材料でELN採用、オープンソースに存在感
CCSは、物質・材料に関する研究を支援する目的で開発されたITソリューションで、計算理論に基づくモデリング&シミュレーション(M&S)、研究情報を管理するケムインフォマティクス/電子実験ノート(ELN)、生命情報を解析するバイオインフォマティクス、特許や科学技術文献などを調査するためのデータベース(DB)サービスなど、さまざまなシステムが利用されている。
こうしたCCS関連の各種ソリューションを開発・販売している国内主要ベンダーの売り上げの推移をもとにした2018年度の市場規模は、CCSnews調べで約448億円。前年度に対して2.1%成長したとみられる。いわゆるリーマン・ショック後は一貫して成長基調だが、前年度については伸び率がやや低下した。
これは、ここ数年、成長を牽引したポストISISブームが一段落したことが理由の一つだと考えられる。製薬企業を中心に化合物情報の登録・参照系の再構築が進んだもので、現在もその流れをくんだ案件がいくつか進行中だが、大方の需要は2017年度までにほぼ満たされたようだ。ELN導入を中心とした需要は引き続き伸びているが、ブーム期の一時的な伸びをカバーすることは難しいということだろう。
ただ、ELN市場自体は活況で、医薬品研究開発のオープンイノベーションに合わせて、外部パートナーと連携するための情報基盤として、利用形態が高度化してきている。さまざまな周辺アプリケーションと接続するとともに、クラウド環境への移行も多くみられるようになってきた。さらに、化学・材料研究においても、実験記録や研究データを本格的に蓄積し活用を図りたいとする考え方が主流になり、その基盤としてELNを採用する例が増えてきた。
一方、M&S市場においては、計算エンジンとして近年はオープンソースソフトウエア(OSS)の存在感が増してきている。このため、商用パッケージを中心とした市場規模の数字にあらわれない部分で、計算需要が拡大している。とくに、量子化学計算の「QuantumESPRESSO」、分子動力学計算の「LAMMPS」や「GROMACS」といった海外製OSSは人気が高いため、商用M&Sパッケージの多くがこれらとのインターフェース機能を提供しており、初心者にも使いやすくなってきている。クラウドサービスにおいても、これらのOSSは利用頻度が高く、事業者側である程度の動作環境を整備していることも多いため、手軽に利用することが可能。ベンダーが開発している商用の計算エンジンももちろん健在だが、全体的にみて、計算エンジンについては無償のOSSの方に勢いがある。アカデミック製プログラムが母体になっていて、新しい計算理論が取り込まれるなど進歩が早いためだ。商用ソフトは、外部OSSを活用するためのプラットフォーム機能を充実させる傾向が強くなっている。
◇ ◇ ◇
AI/機械学習への投資拡大、国内で産官学プロが進行
今回の市場規模にあまりあらわれていない部分で活況を呈しているのが、AI/機械学習の分野だ。生命科学関係では「AI創薬」、材料科学関係では「マテリアルズ・インフォマティクス」(MI)という言葉がキーワードになっている。とりわけ産業界の関心は高く、PoC(概念実証)の段階ではすでに数多くの取り組みがみられ、AIによる一定の成果・効果が確認されてきている。国内では数年前から産官学共同プロジェクトがいくつか実施されており、それらに手応えを得て、企業がAIベンチャーらと個別に共同研究を展開するケースも増えてきている。実際には、CCS関連領域におけるAIへの投資は、昨年度かなりの伸びを記録したと考えられる。
具体的に、生命科学分野におけるAI創薬の代表的な産学プロジェクトが「ライフインテリジェンスコンソーシアム」(LINC)である。2018年冬の本特集で詳しく報じたが、医薬品研究開発のライフサイクル全体を網羅する10個のワーキンググループに分かれ、約30種類のAI開発に取り組んでいる、アカデミアの研究機関が13、民間のライフサイエンス企業が48、IT関係の企業が38参加しており、プロジェクトは来年夏で一区切りとなる。
今年2月に開催されたLINC全体報告会では、先行しているワーキンググループのうち4チームが開発状況をプレゼンテーションした。まずは、膨大な論文データから共同研究者を発掘するためのAIで、“媒介中心性計算”と呼ばれる手法を利用し、論文の共著関係から人間関係の広がりを抽出するとともに、その経年変化を追跡し、媒介中心性の伸びの良い研究者をピックアップする。すでに商用化に名乗りを上げているベンダーがあり、今年中に正式サービスがスタートする予定。2番目は、深層学習を用いた高精度分子力場の開発。電子状態を精密に解析できる量子化学計算(QM)の結果をAIに学習させることにより、分子力場計算(MM)程度の計算コストでQMレベルの精度を得られるようにするという。
3つ目は、構造式からADMET(薬物動態・毒性)予測を行うためのAIで、“WLラベル拡張”と呼ばれる手法によって学習させる構造情報を膨らませることで精度が大きく向上するという研究結果が報告された。最後の4番目は、中央社会保険医療協議会(中医協)が作成した費用対効果評価の分析ガイドラインに沿ってシステマティックレビューを実施する際、膨大な文献調査を行いエビデンスを集める作業をAIで効率化しようとしている。
一方、材料研究分野のMIについては、文部科学省プロジェクト「情報統合型物質・材料開発イニシアティブ」(MI2I)と経済産業省プロジェクト「超先端材料超高速開発基盤技術プロジェクト」(超超PJ)が産官学連携のスタイルで実施されている。文科省プロは非競争領域を中心としてMIのより基礎的な技術開発と実証研究を進めているのに対し、経産省プロの方は産業界のニーズに一歩踏み込んだかたちで、個別企業の研究テーマを意識した共同研究が行われているようだ。具体的な成果のいくつかは、昨年から今年にかけて学術論文あるいは企業広報のかたちで公表されつつある。
また、MI関連では内閣府が推進する「戦略的イノベーション創造プログラム」(SIP)における「革新的構造材料」の課題の1つとしてマテリアルズインテグレーションの開発(SIP-MI)が行われてきた。MI2IとSIP-MIはどちらも中心となる研究機関が物質・材料研究機構(NIMS)であり、NIMSはこの両拠点を統合型材料開発・情報基盤部門(MaDIS)に結集させて、緊密な連携を図ろうとしている。
SIPは第2期が2018年度から前倒しでスタートしており、「統合型材料開発システムにおけるマテリアル革命」において「先端的構造材料・プロセスに対応した逆問題MI基盤の構築」の取り組みが進んでいる。SIP-MIが唱えるマテリアルズインテグレーションは、実験・理論・経験式・数値シミュレーションをデータ科学を活用して融合させ、計算機上で製造プロセスから性能までを一気通貫で予測するシステム。第1期は金属材料に生じる物理現象を数値モデルで記述し、疲労やクリープなどを予測する手法を確立したが、第2期では材料に要求される「性能」を出発点に、性能を発揮させる「組織」「特性」を提案し、さらにこれらを実現するための「製造プロセス」を最適化するという逆問題に挑戦する。その過程では、マテリアルズインテグレーションとマテリアルズ・インフォマティクスとの連携が図られる可能性もある。
今世紀に入って、日本の製造業はグローバルで旗色の悪くなる分野が増えてきているが、素材・材料開発は日本が優位性を保っている分野の代表格だといわれている。その意味で、MIの実用化は日本の産業競争力のカギを握っていると言っても過言ではないだろう。
いずれにせよ、AI創薬もMIもコア技術はAI/機械学習だ。しかし、最も重要なのはデータである。いかに質の高いデータを蓄積し、利活用できるように整備していくか、本当の勝負所はそこにある。