2018年冬CCS特集:第1部総論(業界動向)

人工知能(AI)活用で革新を模索、生命科学・材料科学の両分野で展開

 2018.12.04−コンピューターケミストリーシステム(CCS)は、医薬・化学・機能材料など化学物質を中心とする研究開発を支援するソリューションとしてますます注目を集めている。先進的な機能性を実現するため、あるいは魅力ある製品づくりを行う目的で、材料特性にまで踏み込んだ研究を行う必要性が高まっているからだ。とくに、分子構造が重要になる医薬分野はもとより、ナノ材料開発においては原子・分子レベルによる機能発現がカギを握るため、モデリング&シミュレーション技術の利用は不可欠だ。それに加え、ここ数年で人工知能(AI)による革新を模索する動きが急速に高まってきた。AI創薬やマテリアルズ・インフォマティクス(MI)という言葉が注目を浴びており、CCSベンダー側でも徐々に対応を取りつつある。

                 ◇       ◇       ◇

◆◆深層学習で第3次ブーム、産官学連携に高まる関心◆◆

 CCSベンダーが提供するシステムは、対象領域のカテゴリーで大きく生命科学系と材料科学系、システム種別の観点でインフォマティクス系とモデリング&シミュレーション(M&S)系、またライセンスの種類で商用ソフトとオープンソースソフト(OSS)に分けることができる。また、システムの運用形態の違いでは、社内のサーバーやPCにインストールして利用するオンプレミス型と、外部のデータセンターを利用するクラウド型とに分かれる。さらに、インターネット経由で利用できるデータベースサービスは、学術文献や特許などをもとに、物質・材料の分子構造や結晶構造、各種の実験データなどを分類・整理し収録したもので、用途に応じてさまざまなデータベースが開発されている。CCSベンダー各社はそれぞれの出自や得意技術の違いがあり、ある程度のすみ分けができているため、それぞれの領域で競合関係にある企業の数はそれほど多くない。

 そうしたなか、ここ数年急速に立ち上がってきたのが、AI/機械学習である。ユーザーの関心が高いことは、ベンダーが開催する関連セミナーやフォーラムなどでの集客からも感じ取ることができる。直近の例は、11月に開催された富士通ライフサイエンスフォーラム。医薬品業界におけるAI活用事例を主要なテーマに、大手製薬企業の幹部らがパネルディスカッションに登場するとあって、会場のキャパを超える来場者が詰めかけ、ライブ配信のサテライト会場を用意するほどだった。その翌日に行われたJSOLのJ-OCTAユーザー会議は、MIや機械学習に関係するユーザー事例発表があったことが注目されたと思われるが、やはり聴講者多数で、会場レイアウトを急きょ変更するほどの盛況ぶりだった。富士通九州システムズが9月のCBI学会で行った研究発表は、ライフインテリジェンスコンソーシアム(LINC)で進めているAI開発事例を取り上げたもので、事前にほとんど宣伝していなかったが、会場は立ち見が出るほどの混雑をみせたという。

 こうしたことから、ユーザーはCCS分野におけるAI活用に本腰になり、積極的に情報を集めている様子がうかがえる。実のところ、AIとCCSには深い関わりがあり、AIの第1次ブームとされる1960年代において、世界初のエキスパートシステム(ES)といわれたのが、1965年にスタンフォード大学のリーダーバーグ博士が開発した「DENDRAL」だった。赤外スペクトルから化学構造を推定する機能があったとされる。

 ESは、専門家が持つノウハウを知識ベース(KB)に集約し、それをもとに推論するシステムで、1980年代の第2次AIブームを牽引した。ただ、専門的な知識を事細かにKB化することに限界があったことに加え、そもそも言語化しにくい知識も多かったことから十分な実用性を示すことができず、その後のAI研究は長い冬の時代を迎えることになったといわれている。

 現在の第3次ブームのさきがけとなったのは、グーグルが2012年に猫を認識するAIを開発したこと。人間が猫を見てなぜ猫だとわかるのかをKB化してESに教え込むことは不可能に近いが、インターネット上の大量の猫画像を深層学習(ディープラーニング)することにより、グーグルのAIは自分で学習して猫を認識できるようになった。2018年の現在、AIブームは衰えるどころかますます加熱し、画像認識や音声認識などすでに実社会での利用がはじまってきている。とくに、AIの“目の良さ”はすでに人間を超えたといわれている。

 ただ、深層学習はいわばブラックボックスであり、例えばグーグルのAIも画像の中の何をもって猫だと判断しているのかはわからない。科学では原理や法則が重要であり、「判断のもとになる根拠がわからないのでは、科学的に信頼できない」という指摘がなされている。これに対し、推論の根拠を提出できる“説明可能なAI”の研究も進んでおり、AIの利活用はCCSにおいてもはやとどめようのない流れになっているといえるだろう。

 とくに、ユーザーの関心をかき立てているのが、国内で行われているプロジェクトの存在だ。MIについては、文部科学省プロジェクト「情報統合型物質・材料開発イニシアティブ」(MI2I)と経済産業省プロジェクト「超先端材料超高速開発基盤技術プロジェクト」(超超PJ)が実施されたことで、産業界の関心に火がついており、論文や学会発表のレベルでは多くの実績があがりつつある。また、AI創薬に関しては、第2部で詳しく紹介するが、京都大学などの音頭取りで設立されたライフインテリジェンスコンソーシアム(LINC)の活動が注目されている。新薬の研究開発の上流から下流までの細かなプロセスを支援するAIを開発し、最終的にそれらのAIをすべてつなげようという壮大で野心的な計画だ。これらのプロジェクトは、産官学連携のスタイルで推進されており、民間の製薬・化学などの企業が多数参加している。

                 ◇       ◇       ◇

◆◆ベンダー各社対応に本腰、データ蓄積へあの手この手◆◆

 現在、何らかの学習済みAIを提供するCCSベンダーはないため、ユーザーは前出のプロジェクトなどで開発・用意されたAIツールを利用して、自前でのAI開発に取り組む必要がある。あるいは、海外にはAIアナリティクスに特化したベンダーが850社あるともいわれており、彼らの力を借りることもできる。ほとんどはAI一般の企業で化学や医薬の専門知識はないが、AI創薬に関連した技術を持つスタートアップ企業として、Afecta Pharmaceuticals、Atomwise、BenevolentAI、Berg Health、Biovista、BioXcel、Cloud Pharmaceuticals、e Therapeutics、Edelris、Evince Biosciences、Exscientia、Insilico Medicine、Mind the Byte、NuMedii、Numerate、Recursion Pharmaceuticals、Relay Therapeutics、Resonant Therapeutics、Sparrho、Synthace、twoXAR、Verge、加えて日本にあるSyntheticGestaltといった名前をあげておきたい。

 その一方で、既存のCCSベンダーもAIに向けての取り組みを進めはじめた。まずは、電子実験ノートのベンダー。創薬研究領域が主な用途だったが、電子ノートの仕組みがMI研究におけるデータ収集のための基盤に最適だとして需要が伸びている。富士通がこの分野で激しい売り込みをかけており、化学企業に対するパーキンエルマー製「E-Notebook」の導入実績を着々と積み重ねている。同様に、電子ノートを提供しているドットマティクスやダッソー・システムズも、最近は化学企業からの関心が高いと話す。

 既存のCCSプラットホーム上で機械学習/深層学習を行えるようにしようとする取り組みも目立つ。シュレーディンガーが研究コラボレーション環境の基盤となる「LiveDesign」で、スタンフォード大学と共同開発した深層学習技術“DeepChem”を利用したAI開発が行えるようにするほか、JSOLも材料物性解析ソフト「J-OCTA」で、シミュレーションに加えて機械学習も行えるように機能強化する方針を打ち出している。また、クラウド電子ノートを提供しているアークスパンは、クラウド上のデータを取り出し、社内データと合わせて機械学習に利用したいというユーザーの声に応える新機能を開発した。さらに、アドバンスソフトの「Advance/NanoLabo」はマサチューセッツ工科大学が公開しているMI向け材料データベース「マテリアルズプロジェクト」に接続して構造検索を行う機能を用意している。

 一方、とくにMI分野は機械学習に利用できるデータ自体が少ないという問題もある。これに対する解決策として、計算化学によるシミュレーション結果を学習データに使おうという考え方が出てきている。材料シミュレーションは対象とする系が大きく、計算時間がかかるため、これも簡単ではない。そこで、モルシスでは、米マテリアルズデザインが開発した「MedeA-HT」の紹介をはじめた。多数のモデル構造に対する同じ条件を適用した計算を、フローチャートに従って並列処理させることにより、大量のデータを生成することができる。また、伊藤忠テクノソリューションズは、米エクサバイトの「Exabyte.io」を提供中。これは、クラウドの高速計算環境を利用し、MI用の計算を加速させるという狙いがある。

 他方、計算に時間がかかるなら、計算せずに計算結果をAIで予測しようという試みもある。シュレーディンガーが社内で研究しており、密度汎関数法(DFT)計算結果を学習させ、計算結果を予測するAI開発を行った。実際にDFT計算を行うよりも、1万倍速く結果が得られたという。国内では、産業技術総合研究所と東京大学生産技術研究所のグループが同様の研究を報告しており、原子化エネルギーを100分の1秒で誤差0.01エレクトロンボルト以下の精度で予測できたとしている。精度は第一原理計算と同等で、やはり計算するより1万倍速いという。

 現在は、物質・材料の構造や組成から物性を予測する計算が進められているが、MIやAI創薬の最終的なゴールは“逆問題への解答”である。すなわち、望ましい活性や材料特性を持つ構造や組成をAIで予測したいということだ。CCSにおけるAI研究の次なるステップは、確実にこちらの方向に向かうだろう。

 実際にAIを開発できる国内CCSベンダーは少ないと思われるが、富士通は独自のAI技術「Zinrai」を全社的に押し出していることもあり、LINCへの参画も含めて積極的な開発を進めている。同社は国内のCCSベンダーとして最古参の1社で、かつては自社開発製品がメインだったが、近年は海外のパッケージをベースにしたビジネスが主流になっている。AIをテコにCCS事業がどう変化するか期待したいところだ。

                 ◇       ◇       ◇

◆◆CCSに再来するかVRブーム◆◆

 ところで、IT業界のトレンドとしては、AIの次に来るのはバーチャルリアリティ(VR)だとする意見が強い。実は、VRも1980年代にブームがあり、かつてはCCSとのかかわりもあった。ブームに先立つ1971年、ノースカロライナ大学で“GROPEプロジェクト”がスタートしたのがその始まりだ。当時はまだ手袋型のデバイスがなかったため、放射性物質を遠隔から扱うためのマニピュレーターアームを利用し、薬物分子と受容体タンパク質とのドッキングスタディが行われた。

 GROPE IIIと呼ばれる後期型のシステムの写真が残されているが、部屋の天井から巨大なマニピュレーターがぶら下がっていて、オペレーターは立体視ゴーグルをかけ、前方の大型プロジェクションディスプレイに向かって操作する。オペレーターが医薬品分子を受容体の近くにもっていくと、分子に働く引力と反発力を感じることができたという。分子表面の静電ポテンシャルやファンデルワールス力、疎水性・親水性、水素結合などの影響が力のフィードバックとして示された。GROPEプロジェクトは広く実用化には至らずに終わったようだが、次に来るといわれるVRブームがCCS市場に再来するかも興味深い。


ニュースファイルのトップに戻る