2018年冬CCS特集:第2部総論(技術動向)

AI創薬で医薬品研究開発にイノベーション、産官学連携でLINC始動

 2018.12.04−近年、コンピューターの力を借りて医薬品研究を行う“IT創薬”“インシリコ創薬”が注目されてきたが、ここへ来てそれらを発展させた“AI創薬”がブームになっている。人工知能(AI)の進歩はまさにすさまじく、特定の分野ではすでに実用化が進み、社会やビジネスで実際に使われはじめている。そうしたなか、開発期間が十数年、開発費用が数千億円もかかる新薬の研究をAIで効率化できないかという発想は、ある意味自然な流れである。まだまだ基礎的な段階ではあるが、世界中でAI開発が進められており、研究プロセスの限られた用途ではAIによる一定の効果も認められはじめている。とくに、国内で行われているライフインテリジェンスコンソーシアム(LINC)の取り組みが脚光を浴びている。

                  ◇       ◇       ◇

◆◆探索から市販後まで約30種のAI、2020年夏には社会実装へ◆◆

 CCS特集第1部でも取り上げた通り、深層学習(ディープラーニング)と呼ばれる技術がAI研究の新しい扉を開いた。猫や犬の画像を認識することからはじまったが、広く一般から注目されたのは、やはり将棋や囲碁のプロにAIが勝つようになってからだろう。

 問題の複雑さとして、例えばチェスの場合、打ち手の可能性は10の50乗〜10の120乗通り、将棋は最大10の220乗通り、囲碁になると最大10の360乗通りにも達するといわれる。これに対し、低分子創薬の探索空間は10の60乗通りである。ところが、これまでのところAI創薬で目覚ましい成果は得られていない。将棋や囲碁は複雑とはいえ、ルールが定められた“完全情報ゲーム”であり、選択肢の中に正しい答えを見いだせるが、創薬の場合は10の60乗通りをすべて調べたとしても答えがあるとは限らない。複雑さの種類が違うということだろう。

 また、AIで何を予測するかも難しい問題だ。従来のCCSでも、統計的な手法(第2世代までの機械学習法も含まれる)で予測モデルを構築し、活性や薬物動態、毒性などを予測することが行われている。これをAIに置き換えることが考えられるが、AIならではの新しい用途が開かれる可能性も高い。やはり、医薬品開発に携わる現場からのアイデアが必要だ。

 そうした背景のもと登場したのが、ライフインテリジェンスコンソーシアム(LINC)である。これは、2016年11月、京都大学大学院医学研究科を中心に、都市活力研究所、理化学研究所、医薬基盤・健康・栄養研究所が発起人となって設立され、研究活動を続けている。産官学連携で“AI創薬”を目指す取り組みであり、AIを開発する企業・アカデミア(主にIT系)と、AIを利活用する企業・アカデミア(製薬・化学・食品・医療・ヘルスケア関連などのライフサイエンス系)とのマッチングを促進するという方法を採用している。

 このため、メンバーは非常に幅広く、アカデミアの研究機関が11、民間のライフサイエンス企業が48、IT関係の企業が34、その他の機関・グループが8と、トータル101機関(今年10月現在)が参画。企業や大学が単独ではつくり出せないAI基盤の形成を目指し、10のワーキンググループと30のプロジェクトに分かれて具体的な研究を進めている。基本的には現在、非競争領域内での活動において予測目標にそったAIを設計してモデルを開発し、標準モデルは原則としてコンソーシアム内で公開される予定。各企業は、それぞれの競争領域でインハウスデータを用いてこのAIを利活用していくことになる。

 ワーキンググループおよびプロジェクトの構成は利用者側の要望が反映され、ワーキンググループ1(WG1)「未病・先制医療」として、「健康診断データによる発症予測」「マイクロバイオーム・オミクスデータ解析」「デジタルヘルス」の3プロジェクトが走っている。以下、WG2「臨床・診断」のもとで、「がんゲノム医療におけるAI活用」「シミュレーションによる細胞分離」「AIによる病理画像処理」「AIによる電子カルテ処理」、WG3「創薬テーマ創出」のもとで、「有望提携先や研究テーマの自動探索」「標的分子探索」「ドラッグリポジショニング」、WG4「分子シミュレーション」のもとで「タンパク質立体構造・機能予測」「AIによるドッキング計算高度化」「分子動力学計算におけるAI活用」「AIを用いた高精度分子力場」、WG5「メドケム・分子設計・ADMET」のもとで、「合成経路予測」「分子設計AI」「化合物記述子表現」「QSAR/QSPR/in vitro ADMET予測」、WG6「トランスレーショナルリサーチ」のもとで、「非臨床データからのヒトADMET予測」「疾患メカニズム解明・ブリッジング予測」、WG7「バイオロジクス・製剤・ロボティクス」のもとで、「バイオロジクス関連AI」「結晶形・製剤関連AI」「調剤ロボティクス」、WG8「治験・市販後・メディカルアフェアーズ」のもとで、「AIによる治験の効率化」「有害事象の情報基盤」「製品Q&Aシステム」「アウトカムリサーチ・医療技術評価」、WG9「知識ベース・自然言語処理」のもとで「知識ベース・自然言語処理」、WG10「AI基盤」のもとで「ライフサイエンスのためのAI基盤」−が実施されている。

 ワーキンググループのテーマをみるとわかるが、医薬品開発のライフサイクル全体を包括しているのがLINCの最大の特徴。代表を務める京都大学の奥野恭史教授も、「この領域で欧米にもいくつかのプロジェクトがあるが、100社が分担して約30種のAIをつくり上げるような大がかりな取り組みはない。先行している研究グループもあるが、それは一部分だけのことで、われわれのように全部を結びつけようというシームレスな構想を描いているところは皆無だと思う。総勢500人を超える参加者が分担して一気に開発しているので、あと2年あれば、頭ひとつ抜け出すことができる」と自信をみせる。

 それぞれのプロジェクトで専用のAIが開発されており、進行状況は順調だという。各プロジェクトには、学習用データの準備、独自AIの開発、AIプロトタイプの構築などのマイルストーンが設定されているが、臨床データを学習に利用するようなプロジェクトが個人情報を扱うためにやや遅れている程度だという。「有望提携先や研究テーマの自動探索」「結晶形・製剤関連AI」などはすでにプロトタイプまでが完成している。来年夏ごろには、かなりのプロトタイプを実際に目にすることができるようになるという。

 とくに、WG4やWG5で扱っているテーマは、従来のインシリコ創薬がカバーしてきた分野でもあるが、タンパク質と薬物分子との結合様式や結合の強さの予測、また活性や物性、薬物動態や毒性の予測など、AIでさらに精度を向上させることが、ひとつの狙いとなっている。一方、分子動力学(MD)計算は出力データが膨大で十分に生かされていないという問題に着目し、MDトラジェクトリーを網羅的かつ客観的に解析するAIなど、従来手法を補完する試みも行われている。MD計算結果から、結合様式や親和性、結合キネティクス、作用機序などの結合プロファイルを高精度で予測することが期待される。計算化学で利用する分子力場の精度を向上させるため、機械学習を利用しようというプロジェクトも進められている。

 機械学習はブラックボックスとなり、予測のもとになっている要因が科学的に信頼できるかという心配もあるが、AIが何を学習し、どこを認識しているかを可視化する研究も行われている。いわゆる“説明可能なAI”で、例えば化学構造のどの部分が水溶性に関係しているかという予測で、AIが着目した要素が化学的にも正しいと確認されたなどの結果が得られているようだ。従来の統計モデルを用いた物性予測・毒性予測などとの比較でも、同じデータセットを使っても、深層学習の方が予測率が高くなることが多いという。

 LINCの活動は3年で一区切りをつける計画で、2020年夏にはそれぞれのメンバーによる事業化や社会実装がはじまる。奥野教授は、「AI開発で日本は諸外国に後れを取ったといわれているが、AI創薬に関しては状況が違う。本格的に新薬を開発し創出する能力を持っているのはアジアでは日本だけだし、LINCの包括的な取り組みで創薬という特殊なノウハウを注入したAI構築においては、欧米にも打ち勝って世界をリードできる」と述べる。資金力に劣る日本の製薬業界にとって、創薬研究開発の構造改革は重要な要件であるとともに、日本のIT業界にとっても、AI創薬をテコにしてAI競争の後れを取り戻す絶好の機会となる可能性があるだろう。


ニュースファイルのトップに戻る