NECが三菱スペース・ソフトウエアとBLASTソリューションで提携

Express5800クラスター上でParacel BLASTを稼働、128CPUで200倍高速

 2002.09.03−NECと三菱スペース・ソフトウエア(MSS)は2日、バイオインフォマティクス分野で相互に製品の販売提携を結んだと発表した。遺伝子配列の相同性検索の代表的ツールであるBLASTを高速で利用できる環境を共同で提供していく。ハードウエアには、NECのExpress5800をベースとしたPCクラスターを使用し、MSSが販売権を持つ米パラセル社の「Paracel BLAST」を搭載してシステム販売を行う。インストールやシステム設定などの面倒な手間をかけずに“BLAST専用機”として簡便に利用できるため、国立研究機関などの大規模なシステムだけでなく、製薬会社などの民間での導入が活発化すると期待。年間100セットの販売を見込んでいる。

 BLASTは、バイオ研究において必ずと言ってもよいほどに利用される定番のソフトだが、近年では検索したい配列のクエリーが長大化したり大量化したりしていることに加え、検索対象のデータベース(DB)も日ごとに膨れ上がっているのが現状。このため、BLAST処理を高速化することがバイオ研究全体のスループットを向上させるうえで大きな要素としてクローズアップされてきている。

 今回の提携は、NECのハードとMSSのソフトを組み合わせて高速なBLASTソリューションを実現しようというもの。MSSは、米パラセル社のゲノム解析のための統合ソリューションの国内代理店を務めている。パラセル製品群は、BLAST解析のための専用計算機システムである「GeneMatcher2」および「BLASTMACHINE」のほか、配列解析のための各種ソフトウエアツール群がそろっている。今回は、パラセルが開発したクエリー分割、DB分割、クエリーパッキング技術を用いて高度な並列化対応を図ったBLASTプログラムであるParacel BLASTをExpress5800に適応させた。パラセルのソフトウエア環境は、もともと一般的なPCサーバーをサポートできるようになっているため、特別な移植作業などはなかったという。

 パラセル製品では、GeneMatcher2はカスタムVLSI ASICを採用した完全な専用機となっており、一方のBLASTMACHINEは汎用のPCサーバーを内蔵したクラスター型のシステム。そのため、今回のNECとの共同ソリューションはBLASTMACHINEに近い構成となる。いずれにしても、動作するアプリケーションはParacel BLASTで共通。機能は同等であり、MSSとしてはユーザーの選択肢を広げるという意味と、マーケティング戦略上の観点からNECをサポートしたようだ。

 ただ、ハードウエアが日本のNEC製となるため、メンテナンス対応などの信頼性の面で訴求力が増したともいえる。また、Express5800はブレードサーバータイプのユニットも用意されているため、システム全体を小型化できるというメリットもある。今回の共同ソリューションは、パラセル社の承認は得ているが、日本市場だけの限定的な製品となっている。

 さて、システムの性能面であるが、Paracel BLASTとExpress5800/並列クラスターを組み合わせることで200倍以上の高速化を達成することが可能。実際のベンチマークでは、1プロセッサーのPCサーバーを用いて約50億塩基対の配列DBに対する約600万塩基対のクエリーを用いた相同性検索を行うのに約1週間の時間が必要だが、128プロセッサー構成の同クラスターシステム上で実行することにより、わずか50分で処理が完了したという。

 Express5800/並列クラスターはLinuxベースのシステムで、ラックマウントサーバーからブレードサーバーまで用途に合わせたハードウエアが選択できる。ミリネットやギガビットイーサネットなどの高速ネットワークをあらかじめ統合した形で提供されることも特徴。バイオインフォマティクス分野では、理化学研究所・ゲノム科学総合研究センターや大阪大学・バイオグリッド基盤システムなどへの導入実績がある。ただ、民間への普及が遅れているため、今回のParacel BLASTのサポートで企業向けの案件が増えることを期待しているようだ。

 また、NECでは、国産クラスター技術の“SCore”を利用して、PSI-BLASTをメッセージパッシング方式で並列化し、Express5800/並列クラスターに最適化したBLASTプログラムも提供している。アミノ酸の相同性検索を高速化することができ、ベンチマークでは約3億残基のアミノ酸配列DBに対する約200残基のクエリーを使用したジョブの場合、32プロセッサー構成で単一プロセッサーマシンに比べて13倍以上の高速化を達成した。

 これにより、塩基配列の相同性を検索するParacel BLASTとアミノ酸配列の相同性を検索するNEC版PSI-BLASTの両方が、Express5800/並列クラスター上で利用できることになった。総合的なBLASTソリューションとして売り込んでいく。

 価格は、8ノード(16プロセッサー)構成の場合、Paracel BLASTは610万円、PSI-BLASTは80万円、クラスターのハードウエアは700万円となる。

 両社は、それぞれのルートで相互に製品を販売し合うことに加え、共同セミナーの開催や展示会での協力、カタログ制作・共同広告など、マーケティング/プロモーション活動でも全面的に協力していくことになる。