2019年冬CCS特集:第2部総論(技術動向)
MI/AI創薬、新材料・新薬開発へ激化する国際競争
2019.12.03−さまざまな分野で実際に活用が進む人工知能(AI)。研究開発をサポートする存在としても期待が高まっている。医薬分野では“AI創薬”、化学・材料分野では“マテリアルズ・インフォマティクス”(MI)として産業界の関心はきわめて高く、産学あるいは産学官共同プロジェクトとしての取り組みが国内で進行し、着実に成果をあげつつある。ただ、AI創薬やMIの実用化に力を注いでいるのは日本だけではなく、国際競争は非常に激しくなっている。これらの技術は、ゆくゆくは科学技術分野の開発力・国際競争力を支配するとも考えられ、日本経済の将来性にも大きく影響する可能性がある。
◇ ◇ ◇
◆◆材料開発の原因と結果を学習、米中が巨額の投資◆◆
材料開発は何度も試作と実験を繰り返す試行錯誤的な研究方法が主流だったが、データ駆動型のスタイルでこれを革新しようというのがMIの考え方。材料開発で原因(構造・組成など)と結果(物性・機能など)を示すデータを大量に集め、それを機械学習にかけることにより、原因から結果を予測する演繹的なAI、あるいは望ましい結果に至る原因を予測する帰納的なAIをつくり出すことが目標となっている。
もともと、MIは米国発の考え方である。マサチューセッツ工科大学(MIT)が2005年ごろから「マテリアルゲノム」という言葉を使い始め、その流れで米国のMIプロジェクトである「マテリアルゲノムイニシアティブ」(MGI)につながっていった。米国のオバマ前大統領は2011年6月24日にホワイトハウスでMGIのスタートを宣言、その後の5年間に5億ドル以上の予算がこのプロジェクトに投入された。この間、米国立科学財団(NSF)は全米30州の80チームに対し、258件の助成金を供出。米国防総省(DoD)や米航空宇宙局(NASA)でも材料開発のために資金を供給する計画を進めた。米エネルギー省(DOE)とMITはMI研究に利用できる60万件の材料データベースを「マテリアルズプロジェクト」として整備し公開しているほか、MGIの開発成果は米国立標準技術研究所(NIST)によってライブラリー化されており、米国内の研究機関とのリンクや具体的なツール/データベースの利用などを行うことができる。
また、中国は2016年から国家重点研究開発計画「材料ゲノム工学のキーテクノロジーと支援プラットフォーム」として中国版MGIプロジェクトを推進している。5年で総額約8億元(約125億円)を投じるといわれている。中国科学院や中国工学院がMI研究を後押ししており、拠点になるような機関として、2014年に上海大学マテリアルゲノム研究所、2016年に上海交通大学マテリアルゲノムイニシアティブセンター、同年に中国科学院物理研究所と北京科技大学らが共同で「北京マテリアルゲノム・エンジニアリング・イノベーション・アライアンス」、さらに翌年に中国鋼研科技集団有限公司らも参加して「北京マテリアルゲノム・エンジニアリング・イノベーションセンター」が設立されている。さらに、韓国も2015年から10年計画で「クリエイティブ・マテリアルズ・ディスカバリー・プロジェクト」に取り組んでいるという。
◇ ◇ ◇
◆◆国内MIプロ大詰めに、研究論文数は米が圧倒◆◆
さて、日本においては、米国MGIからやや遅れ、2014年度から内閣府が「戦略的イノベーション創造プログラム」(SIP)をスタート。これはいくつもの研究課題で構成されているが、そのうちの「革新的構造材料」の中に“マテリアルズインテグレーション”という名称でMIに近い取り組みがあり、これがSIP-MI(このMIはマテリアルズインテグレーションの略)と呼ばれている。SIPは現在第2期に進んでおり、研究課題の1つである「統合型材料開発システムによるマテリアル革命」の中で、「先端的構造材料・プロセスに対応した逆問題MI基盤の構築」として、SIP-MIの第2期開発が昨年11月から行われている。
続いて、文部科学省プロジェクトとして「情報統合型物質・材料開発イニシアティブ」(MI2I、エム・アイ・スクエア・アイ)が2015年度からスタートした。これは現在最終年度に入っているが、MIで設計した材料を実際に合成して所期の性能があらわれたことを確認した事例などもあり、アカデミックのレベルではかなりの成果を出している。MI2Iは来年2月に最終報告会が開催される。さらに、経済産業省の「超先端材料超高速開発基盤技術プロジェクト」(超超PJ)があって、2016年9月から6年間の予定で実施されている。こちらは、MIで設計した材料を実物にするための高速試作・革新プロセス技術、製造した材料の構造・組成・機能を非破壊で測定するための先端ナノ計測評価技術を加え、材料開発のサイクル全体を超高速化することを狙いとしており、産業界で現実に役立つ技術にすることを目指している。
国内の3プロジェクトはそれぞれ異なる材料分野をターゲットにしており、主にSIP-MIは無機系の金属材料、炭素繊維樹脂複合材料、耐熱粉末金属プロセス、セラミックス基複合材料(CMC)、MI2Iは蓄電池材料や磁性材料、伝熱制御・熱電材料、超超PJは有機系を中心に半導体材料、誘電材料、超高性能ポリマー、超高性能触媒、ナノカーボン材料などが対象。日本全体で考えると、補完し合って材料開発の全体像をうまくカバーするスキームになっている。ただ、予算規模は米国や中国に比べるとケタが小さい。主要3プロジェクト以外にも、科学技術振興機能(JST)や新エネルギー・産業技術総合開発機構(NEDO)の助成金がMI関連のさまざまな研究に投じられているが、予算のハンディキャップは厳然としている。
SIP-MIとMI2Iの推進拠点となっている物質・材料研究機構(NIMS)は今年10月末に材料研究の最新成果発表週間と題し、本部のつくばと都内とでイベント「NIMSウィーク」を実施した。MI関係を主導する国内外のリーダー研究者による講演、最新成果の展示などが行われた。NIMS内で行われているMI関係のポスター発表は総計76枚が貼り出され、まさにMI技術の開花を期待させる盛況ぶりだった。
今回、CCSnewsでは、一般社団法人化学情報協会の協力を得て、グローバルなMI研究の現状を、米ケミカルアブストラクツサービス(CAS)の「SciFinder-n」を用いて文献調査した。その結果は別表およびグラフに示した通り。MITが“マテリアルゲノム”のコンセプトを打ち出した2005年以降で、マテリアルゲノムやマテリアルズ・インフォマティクスというキーワードがタイトル・抄録・索引に入っている文献を検索した。対象にしたデータベースはCAplus(物質科学分野の文献を網羅的にカバー)で、論文数は全部で441件ヒットした。該当する文献は2012年あたりから増えて、2015年に急増している。大半が雑誌や学会のアブストラクトで、特許はほとんどなかった。
基本的に年々増加傾向であり、MI研究がグローバルで活発になっていることを裏付けている。2018年の88件が一番多かったが、今年も前年並みの水準には届きそうだ。MIはAIや情報処理系の分野でも研究が行われているが、今回はそちらはカバーしていない。ただ、全体的な傾向は同様だと考えられる。
別表は、文献を出している上位35組織を抽出したもの。国別では、米国が24機関、中国7機関、日本2機関、スウェーデンとイスラエルが1機関という結果である。やはり、米国の大学や研究機関が強いが、中国も中国科学院、北京大学や上海大学が入っており、存在感がある。日本も安穏としてはいられないだろう。
◇ ◇ ◇
◆◆AI創薬でLINCが成果、データとモデルの共有に課題◆◆
一方、AI創薬に関しては、日本では産学官共同のライフインテリジェンスコンソーシアム(LINC)が2016年11月、京都大学大学院医学研究科を中心に、都市活力研究所、理化学研究所、医薬基盤・健康・栄養研究所が発起人となって設立され、AIを開発する企業(主にIT系39社)と、AIを利活用する企業(製薬・化学・食品・医療・ヘルスケア関連などのライフサイエンス系51社)、さらにアカデミア11機関を含むトータル112機関が参加。AI創薬を具現化する約30種類のAI開発を一斉に進めている。
プロジェクトは来年夏で一区切りとなるが、第2期に進むことはほぼ確実となっている。今年に入って、研究成果をオープンにしつつあり、今年2月の全体報告会で4プロジェクト、10月の報告会では8プロジェクトが開発成果や進捗状況を発表した。項目だけをあげると、2月は「有望提携先や研究テーマの自動探索」「AIを用いた高精度分子力場」「QSAR/QSPR/in vitro ADMET予測」、「アウトカムリサーチ・医療技術評価」の4つ、10月は「AIによる病理画像処理」「膨大な論文データより共同研究者を発掘するAIの創成」「ドラッグリポジショニング」「AIによるドッキング計算高度化」「結晶形予測」「アウトカムリサーチ(HERO)/医療技術評価(HTA)」「知識データベースの構築」「調剤ロボティクス 付着粒認識AI」の8つである。
このうち、オープンイノベーションを目的とした共同研究者を効率良く探索するためのAIはすでに開発が完了し、商用化のフェーズに入っている。今年8月、ジー・サーチが「JDreamエキスパートファインダー」の名称でサービスを開始した。科学技術文献の共著関係から人間関係の広がりを抽出するとともに、その経年変化を追跡することで、狙った分野における中心的な研究者や、伸び盛りの若手研究者を捜し出すことができる。
ただ、LINCも決して安心していられる状況ではない。やはり、データ不足が最大の問題であり、データそのものが不足している分野や個人情報保護など手続き上の問題でデータが集めにくい分野は開発が遅れ気味になっている。また逆にデータが十分にある場合でも、そうしたテーマは海外にも研究グループが多いため飛び抜けた予測精度を達成するのが難しい。
さらに心配なのは外国勢の動きだ。今年6月、欧州の製薬企業10社がアカデミアやIT企業を巻き込んで「MELLODDYプロジェクト」を始動させた。LINCは利害関係を考慮して、公開データを収集したり非競争領域のデータを持ち寄ったりしてAIプロトタイプを開発し、そのあと各社が独自(競争領域)のデータを用いてモデルを改良し、実用化を図るという戦略だった。ところが、MELLODDYは各社の競争領域のデータを互いに秘匿しながら利用し、共同学習モデルを作成することを目指している。
AI開発はある意味データの勝負であり、海外に負けないためには、オールジャパンでの連係によるデータとモデルの共有が必要不可欠だと指摘する声が高まっている。LINC第2期に向けては、データを広く集めるための仕組みづくりや、関係する人々および企業・機関の意識の変化をいかに醸成するかが重要な課題になりそうだ。
SciFinder-nによる文献調査、協力:化学情報協会
組織名 | 文献数 | 国名 |
National Institute of Standards and Technology (NIST) | 20 | アメリカ |
Northwestern University | 19 | アメリカ |
Chinese Academy of Sciences | 16 | 中国 |
University of North Carolina | 13 | アメリカ |
University at Buffalo | 12 | アメリカ |
Lawrence Berkeley National Laboratory | 12 | アメリカ |
Rensselaer Polytechnic Institute | 11 | アメリカ |
The University of Tokyo | 10 | 日本 |
University of California | 10 | アメリカ |
Iowa State University | 8 | アメリカ |
Los Alamos National Laboratory | 8 | アメリカ |
Shanghai University | 7 | 中国 |
Argonne National Laboratory | 6 | アメリカ |
Georgia Institute of Technology | 6 | アメリカ |
Kyoto University | 6 | 日本 |
University of Pennsylvania | 6 | アメリカ |
Harvard University | 5 | アメリカ |
Massachusetts Institute of Technology | 5 | アメリカ |
Peking University | 5 | 中国 |
University of Connecticut | 5 | アメリカ |
Zhengzhou University | 4 | 中国 |
Bar Ilan University | 3 | イスラエル |
Beijing Computational Science Research Center | 3 | 中国 |
California Institute of Technology | 3 | アメリカ |
East China Normal University | 3 | 中国 |
Haverford College | 3 | アメリカ |
KTH Royal Institute of Technology and Stockholm University | 3 | スウェーデン |
Lockheed Martin Advanced Technology Laboratories | 3 | アメリカ |
Purdue University | 3 | アメリカ |
SLAC National Accelerator Laboratory | 3 | アメリカ |
University at Buffalo | 3 | アメリカ |
University of Minnesota | 3 | アメリカ |
University of Science and Technology Beijing | 3 | 中国 |
University of South Carolina | 3 | アメリカ |
University of Southern California | 3 | アメリカ |