2021年冬CCS特集:第1部総論(業界動向)

計算とデータ両輪に研究開発DXを牽引

 2021.12.01−コンピューターケミストリーシステム(CCS)は、化学・材料開発や創薬研究を支援するソリューションとして、計算科学とデータ科学を両輪に力強く前進している。コロナ禍で、企業のデジタルトランスフォーメーション(DX)への関心が、トレンドを先取りするようなかたちで急激に盛り上がったことを背景に、“研究開発のDX”を志向する動きを刺激し、CCS業界も活性化している印象がある。とくに、人工知能(AI)/機械学習などのデータ科学分野はベンチャーやスタートアップが国内外に林立しているため、モデリング&シミュレーションやインフォマティクス系の伝統的なCCSベンダーとの間でのコラボレーションがますます進展するだろう。

                 ◇       ◇       ◇

◆◆プラットフォーム化が進展、ラボ内のデータ活用へ◆◆

 CCSには、分子構造や材料構造を設計し、その特性や物性を計算・予測するモデリング&シミュレーション系のシステムと、研究に必要な生物学・化学・材料科学の各種情報を集め、管理したり分析したりできるようにするインフォマティクス系のシステムがある。近年、これらを補完するかたちで注目されたのがデータ科学的な手法で、AI/機械学習に基づくAI創薬やマテリアルズ・インフォマティクス(MI)への取り組みが活発になってきている。

 それにともない、電子実験ノートに代表されるインフォマティクス系のシステムが、データ科学的手法を研究に取り入れる際のプラットフォームとして利用されるようになってきた。また、不足しているデータを補うために、計算科学によるシミュレーション数値を機械学習のデータに活用するという考え方が受け入れられるようになってきた。10年ほど前までは、計算値と実験値を同列のデータとして扱うことに懸念を持つ研究者が多かったが、いまではそうした意識は薄れたように思われる。計算機と計算理論の進歩によって、現実に計測できる物性に結びつくような計算結果が高い精度で得られるようになったからだ。現在、計算科学とデータ科学を共通のプラットフォーム上で統合できるソリューションが実現しつつある。これが次世代のデジタルラボを推進する、つまり研究開発のDXになるという考え方が主流になってきている。

 これは、さまざまなプログラムや方法論を駆使する必要があるため、それぞれに特異な専門ノウハウを持つベンダー各社の連携が進み、その中から買収や合併、再編なども生じている。とくに目立つのが、ラボ内で使われる科学機器メーカーとソフトベンダーとの提携だ。もともと、実験・計測にはソフトウエアが必要で、そのためのプログラムが機器をコントロールするPC内に組み込まれており、測定結果をデータとしてラボ全体で蓄積するという考え方は昔からあった。ただ、かつてはそこでサイロ化してしまっていた。現在のプラットフォームは、機器データをネットワーク化して蓄積、管理共有して、機械学習などで再利用することを目指したものであり、それにはプラットフォームと科学機器との連携が必須。買収などでグループ化を図る動きが近年活発化している。

 とくに、医薬品開発領域では、DXブームに先だって、生物学・化学・薬学・医学の学際的なスタイルでの研究活動が活性化していたため、各種のソフトウエアやデータの連携・統合が促進されており、プラットフォームは多機能化・高機能化する方向にあった。これをもとに買収やグループ化が進んだわけだが、これには機器メーカーがソフトベンダーを取り込む方向と、ソフトベンダーが自社のプラットフォーム上で複数の機器メーカーをサポートする方向との両方があり、またその組み合わせもあるという感じでかなり複雑だ。

 そこに、今回のDXブームが生じたことにより、ライフサイエンス研究だけでなく、マテリアルサイエンス研究にも対応させたかたちで、データ科学と計算科学を活用できるプラットフォームへと発展してきているのが現在の状況だといえるだろう。

                 ◇       ◇       ◇

◆◆DXでコロナ禍でも成長、2021年度米ベンダー2ケタ成長◆◆

 コロナ禍は国内および世界経済に大きな打撃を与えたが、DXブームの恩恵もあり、差し引きで考えるとCCS産業界はこの間も順調に成長しているとみられる。ただ、CCSベンダーは数多く存在するものの、株式公開している上場企業は少ないため、市場動向を数字でみることは難しい。とくに、最大手だった米アクセルリスが2014年に仏ダッソー・システムズに買収され、上場が廃止になって以降は、指標となるベンダーが存在しなかった。そこで、昨年新規にNASDAQに上場した米シュレーディンガーと、すでにNASDAQに上場して長い米シミュレーションズプラスの最新の業績から、市場動向をうかがってみたい。

 シュレーディンガーは、ライフサイエンスとマテリアルサイエンスの両分野をカバーするモデリング&シミュレーション主体のベンダーで、2021年度第3四半期まで(1〜9月期)の売り上げは9,176万1,000ドルの前年同期比22.2%増。内訳は、ソフトウエア事業が7,467万2,000ドルの同10.5%増、創薬事業が1,708万9,000ドルの同28.2%増となっている。ソフトの伸びは、既存顧客からの売り上げの増加と新規顧客の獲得によるもので、新規はマテリアル分野が多いようだ。創薬事業の拡大は、新しいプロジェクトを受注したため。2021年度通年での総売上は1億2,400万ドルから1億3,400万ドルの範囲になると予想されている。伸び率としては前年比14.7%増から23.9%増に当たる数字となる。

 一方、シミュレーションズプラスは、医薬品の非臨床および臨床試験段階で使用するモデリング&シミュレーションソフトと、規制当局への申請に関連したコンサルティングなどを行うベンダーである。2021年度(2020年9月〜2021年8月期)の総売上は4,646万6,000ドルで、前年比11.7%増となっている。6割がソフトウエア事業の収入で約2,770万ドル(同28%増)、4割がサービス&コンサルティング収入で約1,880万ドル(同6%増)である。2022年度の予想としては、売り上げは5,100万〜5,300万ドルの範囲で、前年比で10〜15%の成長を示すと見込んでいるという。

 この両社に代表されるように、他のCCSベンダーも順調に成長しているところが多いとみられる。国内ベンダーは、海外製品を輸入販売するベンダーが多いが、実際に聞いてみると、コロナはほとんど影響がなかったか、影響がいくらかあったとしても、DXブームによる伸びと相殺されて、全体では順調だったとするベンダーがほとんどだ。国内の研究開発DXをめぐる投資は、少なくともあと数年は続きそうであり、いかに魅力的なプラットフォーム像を示せるか、ベンダー間の競争も激化するだろう。

                 ◇       ◇       ◇

◆◆世界一の「富岳」が始動、計算化学のウエート増◆◆

 さて、研究開発DXのプラットフォーム化が進展している理由としては、計算で求めたデータが機械学習に利用できるようになったことが大きい。一昔前の計算化学は扱える分子のサイズが小さく、真空中の孤立系が中心だったが、創薬分野では医薬分子が結合するタンパク質の大規模構造やタンパク質同士の複合体、医薬分子が標的の活性部位に結合する前と結合したあとの薬物−受容体複合体構造の変化、溶液中での振る舞いの解析、また材料科学分野では高分子や分子集合体、結晶構造、非晶・アモルファス、表面・界面、分子レベルよりも大きなメソ構造など、計算可能な系が大規模化・複雑化。その結果、付加価値の高い計算結果が得られるようになり、そのデータを機械学習させることで、逆問題的に望みの物性を備えた物質をある程度予測できるようになってきている。

 とりわけ、マテリアルズ・インフォマティクス(MI)では、データ不足が最初の壁になることが多かったが、計算化学シミュレーションによって学習用のデータをつくり出すという戦略が広く受け入れられるようになってきた。コアの計算エンジンを開発する研究者やベンダーは、これまでは計算精度を高めることや計算対象を広げることに力を入れてきたが、最近では計算結果をどう機械学習に適用するかを活発に議論するようになってきている。

 こうした動きを支えているのが、高性能計算環境であるハイパフォーマンスコンピューティング(HPC)、それを代表するハイエンドのスーパーコンピューターである。その意味で、スーパーコンピューター「富岳」が今年3月9日から共用(本格稼働)開始されたことに注目したい。世界一の性能を持つスパコンであり、開発段階での評価を含め、11月現在のグローバルスパコンランキングで、「TOP500」「HPCG」「HPL-AI」「Graph500」の4部門において昨年6月以降、4期連続で世界第1位を獲得している。フルスペックは、384ノードを搭載した432台の筐体で構成され、トータル15万8,976ノードで、理論最大性能は44京2,010兆FLOPS(毎秒の浮動小数点回数)に達する。

 この「富岳」を頂点にするのが、国内の大学や研究機関のスパコンを結び合わせたHPCI(革新的ハイパフォーマンス・コンピューティング・インフラ)である。「富岳」を設置している理化学研究所計算科学研究センターをはじめ、北海道大学情報基盤センター、東北大学サイバーサイエンスセンター、筑波大学計算科学研究センター、産業総合研究所情報・人間工学領域、東京大学情報基盤センター、東京工業大学学術国際情報センター、最先端共同HPC基盤施設、海洋研究開発機構地球情報基盤センター、名古屋大学情報基盤センター、京都大学学術情報メディアセンター、大阪大学サイバーメディアセンター、九州大学情報基盤研究開発センター−の各機関がスパコン資源を提供している。HPCIの利用促進を担っている高度情報科学技術研究機構(RIST)に対し、研究課題を応募して選定されれば、大学などの研究者や民間企業が無償あるいは有償でこれらのスパコンを利用することが可能。

 「富岳」はフラッグシップシステム、それ以外のマシンは第2階層計算資源と呼ばれており、フラッグシップの50%と第2階層の一部がHPCIのもとで一般利用枠として開放されている。第2階層のマシンには「富岳」と同じアーキテクチャーのArm系機種があるほか、x86系、ベクトル型、クラウド型、XeonPhi搭載型などバラエティに富んでおり、用途に適したマシンを選ぶことができる。

 ただ、民間企業には「富岳」が利用しやすい。一般利用枠50%のうちの5分の1、すなわち全体の10%が産業課題に割り当てられているためだ。年に2回の定期募集があるほか、四半期ごとに選定する機動的課題、使用できる資源量は少ないが随時応募できる試行課題も用意されている。公募課題は成果を公開する必要があるが、有償課題・有償試行課題は成果非公開となり、申し込みも随時行える。

 2021年度の採択実績をみると、「富岳」は物質・材料・化学が25%、バイオ・ライフの課題が15%を占めている。また、民間利用が多いため工学・ものづくりも25%を占める。「富岳」以外の第2階層でも、物質・材料・化学は28%、バイオ・ライフは13%を占めており、やはり計算化学系の課題が多いことがわかる。産業利用の企業数も年々増加しており、「富岳」の前機種の「京」の時代を含めて累計でのべ270社に達している。リピーターが多いことも特徴だが、これは企業がスパコン利用に手応えを感じていることをあらわしているだろう。

 RISTでは、「富岳」で利用されることが多いアプリケーションを特別に整備し、あらかじめインストールしてすぐに使えるようにしたり、講習会を行ったりするなどの利用推進活動を展開中。対象のアプリケーションは、分子動力学ソフトの「GROMACS」と「LAMMPS」、量子化学ソフトの「QuantumESPRESSO」、そして熱流体解析ソフトの「OpenFOAM」の4本である。このことからも、計算化学のウエートが高いことは明白だろう。ほかに、フラグメント分子軌道法ソフト「ABINIT-MP」、分子動力学ソフト「GENESIS」の利用実績がある。HPCIではオープンソースソフトが使われることが多いが、商用ソフトでは量子分子動力学ソフト「VASP」の利用頻度が高い。

 世界一のスパコンを利用できるのは日本の産業界にとってアドバンテージであり、今後も積極的な活用を進めるべきだろう。


ニュースファイルのトップに戻る