富士通がADME/毒性などの予測モデル構築ツールを出荷開始

600種類以上のディスクリプターを発生、高度な特徴抽出機能を装備

 2004.03.22−富士通は、化学データを解析して、化合物の分子構造とADME(吸収・分布・代謝・排出)/毒性などとの相関関係をモデル式として導き出すことができる専用解析ツール「ADMEWORKS/モデルビルダー」(商品名)を国内第1号ユーザーに導入、正式に出荷を開始した。従来のソフトとは発想が異なる製品で、どんな系統の化合物でも、またどんな物性・特性でも扱うことができ、高い精度の予測モデルを構築することが可能。医薬品や環境関連の材料設計分野に売り込んでいく。ソフト価格は500万円。

 ADMEWORKS/モデルビルダーは、QSAR(構造活性相関)解析ツールとして長い歴史を持つ「ADAPT」(ペンシルバニア州立大学のピーター・ジャース教授らのグループによって開発された)をベースに、使いやすい独自のユーザーインターフェースを実装した製品。パソコン上で高度なデータ解析作業を簡単に行うことができる。

 伝統的なQSARでは、まず仮説を立て、それに合わせて重要だと思われるディスクリプター(その化合物の特徴をあらわす記述子)をあらかじめ決定。それに従ってデータ解析を行い、その結果をもとに仮説を検討し直したり、ディスクリプターを選び直したりする。ところが、同モデルビルダーは発想が逆で、最初にディスクリプターを自動発生させ、求めたい物性などと相関の深いディスクリプターを選り抜いていくというアプローチをとる。

 同様の解析ソフトは他にもあるが、今回の製品では発生させるディスクリプターが1化合物当たり644種類と格段に多いのが特徴。これにより、高い汎用性と高精度な相関式の構築を可能にした。他のソフトでは発生させたディスクリプターが100−200個に達すると、ディスクリプターをうまく選別できなくなるというが、同モデルビルダーには強力な特徴抽出機能が装備されており、ユーザーはスプレッドシートの上でディスクリプターを選んで予測率を算出し確認しながら、簡単な操作で試行錯誤を行い、最終的なディスクリプターの種類を絞り込んでいくことが可能。

 例えば、毒性があるかないかなどの“二クラス分類”では、誤分類されやすい境界領域にあるディスクリプターを除く。一方、物性などの数値データを使った“多クラス分類”の場合は、線形重回帰モデルなどを用いて分布から外れたディスクリプターをふるい落としていく。このようにして、644種類のディスクリプターを10数個あるいは数個まで選り抜くことで、最終的に高い精度の予測モデルが仕上がることになる。これらは従来のADAPTで2−3日かかる作業だったが、同モデルビルダーでは1時間以内で完了できるとしている。

 つまり、多数のディスクリプターを数学的手法で厳選するため、ノイズがきわめて少ない化学データ解析が行えるわけであり、このことが相関モデルの精度の高さにもつながっている。同社では、創出可能なディスクリプター数をさらに増やす計画である。

 解析のもとになるデータは、化学構造と関連があればどんなデータでも扱うことができ、ADME/毒性予測を中心とした医薬分野だけでなく、化学物質が生態系に及ぼす影響などの環境関連でも応用が注目される。データセットとしては、3,000化合物までを一度に解析することができる。

 同モデルビルダーで構築した予測モデルは、ウェブブラウザーで簡単に使用できる予測専用システム「ADMEWORKS」に持ち込むことが可能。ファミリーとして、モデル構築から予測実行までソフトが揃っていることも強みとなっている。

 QSARは、1980年代から90年代は医薬品の薬理活性を予測する手法として発展したが、ここ数年はADME/毒性予測などの新しい用途であらためて見直されてきており、今回の製品の市場での評価が注目されるところだ。