菱化システムが米サイテジックの創薬用データマイニングツール発売

データのパイプライン化で複雑なデータ抽出を簡単に実行

 2001.08.01−菱化システムは、米サイテジック社(本社・カリフォルニア州、マシュー・ハーン社長)と販売代理店契約を締結、創薬研究のためのデータマイニングツール「パイプラインパイロット」(商品名)の販売を開始した。画面上にデータソースの種類やフィルタリングの条件式、出力形式などのオブジェクトを配置し、パイプラインのようにつないでいくだけで自在にデータを抽出するプロセスをつくり出すことができる。ウィンドウズNT上で稼働し、年間使用権は1サーバー/1クライアントで900万円。大手製薬会社を中心に、来年末までに10社程度の契約を目指す。

 サイテジック社は、モレキュラーシミュレーションズ(MSI)出身者などが中心となって1999年2月に設立したベンダーで、現在の社員数は約15名。今後4年以内に株式公開することを目指している。

 「パイプラインパイロット」はデータ処理のハイスループット化を実現するソフトウエアで、昨年5月に米国で発売され、これまでに約20社の導入実績がある。現在のバージョンは1.5で、今年の4月にリリースされた。

 最大の特徴は、“データパイプライニング”と呼ばれるデータマイニングプロセスの編集機能。必要なオブジェクトをマウスでドラッグ&ドロップし、それらを相互に結び合わせてフローチャートのようなパイプラインをつくるだけで、複雑なデータ解析のプロセスを簡単にモデル化できる。特定のデータベースやファイル、サードパーティーのパッケージソフト、ユーザープログラム、フィルタリングアルゴリズムなどをオブジェクトとして使用することが可能。

 データソースはさまざまなフォーマットに対応しており、メイブリッジなどのデータライブラリーをはじめ、MDLのISIS、アクセルリスのRS3、スポットファイアーのデシジョンサイトなどの化学データベースシステムとも接続できる。複数のデータソースをまとめて扱う機能があり、相互参照をかけて特定のデータだけを取り出してからフィルタリングするなどの操作も簡単に行える。

 創薬研究で多用する代表的な機能があらかじめ組み込まれており、例えばメイブリッジのデータからリピンスキーのルールにかなった化合物だけを取り出し、化学式・構造式を作成して、logPなどの特性を計算し、エクセルにリスト出力する、あるいは分子ビューアーで三次元構造を確認するなどの一連のパイプラインプロセスを簡単に実行できる。

 また、フィルタリングするためのルールは自由に編集可能で、新しい条件式を付け加えることも、複数の条件を組み合わせて新しいフィルターを作成することも可能。この機能を利用すれば、スクリーニングのアッセイデータをもとに活性のある化合物と活性のない化合物を区別するフィルターをつくらせておき、そのパイプラインに新しいライブラリーのデータを流せば、実際にアッセイを実行しなくても活性のある化合物を予測することが可能になるという。

 使い方が簡単なので、研究者のデータの活用法や発想を刺激し、アイデアを広げる効果があるようだ。

 なお、パイプラインパイロットの本体はウィンドウズNTサーバー上で稼働し、クライアントはNT用のもののほかにウェブブラウザーも利用することができる。さらにODBCを介してオラクルと、XMLおよびRPCを介してUNIX/Linuxマシンと接続することが可能である。