コンパックが遺伝子/バイオ専門全文検索エンジン

64ビットアーキテクチャー生かし、ソリューションで提供

 2000.10.19−コンパックコンピュータは、遺伝子/バイオ分野に特化した全文検索システム「BioSearcher」(バイオサーチャー)を開発した。同社のアルファサーバーの64ビットアーキテクチャーをフルに生かしたVLM(ベリーラージメモリー)技術を利用しており、800万レコードにのぼるGenBankの全件データからフリーキーワードで数秒から10秒程度の短時間で検索が可能になるという。今年の12月から販売開始し、出荷は来年1月からの予定。価格は480万円からとなっている。

 コンパックは、ヒトゲノムの先駆的な解読で有名な米セレーラ社のIT(情報技術)パートナーに選定され、700CPU以上のアルファプロセッサーシステムと80テラバイト以上の記憶装置を納入するなど、バイオインフォマティクス分野で高い実績を誇っている。とくに、64ビットプロセッサーのアルファと64ビットOS(基本ソフト)のTru64 UNIXを組み合わせることにより、アプリケーションとデータベース(DB)を広大なメモリー空間上にそっくり展開することができ、動作速度を従来の数100倍にまで高めることが可能。さらに、バイオインフォマティクスに関する専門サポート体制が同社の強みになっている。

 さて、今回のBioSearcherは日本独自のソリューションとして開発したもので、日本語全文検索エンジン「MitakeSearch」(ミタケサーチ)をベースに、ウェブ対応のユーザーインターフェースを追加し、検索条件の専門化(リファレンス、著者、GenBankへの登録番号、フリーキーワードなど)、完全64ビット対応などを図った。自由にキーワードなどを入力するだけで、遺伝子の配列に関する情報が検索できる。サポートやコンサルティングまでを含めたトータルソリューションとして提供していく。

 ハードウエアにアルファサーバーDS20E、ES40、GS60E/140、GS160/320などを利用した場合、システム価格は480万円程度となる。OSとしては、次期バージョンのTru64 UNIX バージョン5.1以降での対応となり、そのリリースに合わせて製品出荷を開始する予定。 今回のシステムはTru64 UNIX版だが、Linux版も計画しているという。また、BLASTのビューアーなどバイオインフォマティクス関連の各種ツールの開発も進めていくことにしている。

 現在、GenBankなどのDB検索はフリーウエアをベースとするツールで行われることが多いが、最近では個々のDBのデータ量が爆発的に増大しているほか、DBの種類自体も急激に増加しており、高速な検索システムに対する需要が高まってきている。IT業界では、コンパックだけでなく、IBMやサン・マイクロシステムズも高速DBサーバー技術でバイオインフォマティクス市場の案件獲得に力を入れている。