サンのStarfireがヒト遺伝子の推測数の発見に貢献

仏Gene-ITのLASSAPを利用し、仏ジェノスコープセンターが実施

 2000.07.06−米サン・マイクロシステムズの大型UNIXサーバーの働きによって、ゲノムの中に含まれるヒトの遺伝子の数が2万8,000から3万4,000であるという新しい発見が得られた。これは、仏ジェノスコープ・シーケンシング・センター(エソンヌ県エブリー)で行われた研究で、仏Gene-IT(本社・モンテソン、ジャン・ジャック・コダーニCEO)のバイオインフォマティクスソフトウエア「LASSAP」を用いた720億回の計算の結果、明らかになったという。この分野での計算サーバーは、コンパックが実績でリードしているが、サンの追い上げも急。バイオインフォマティクス領域は世界的にも投資が拡大しており、受注競争はますます白熱しそうだ。

 今回の研究に利用されたのは、Ultra SPARCUプロセッサー(400MHz)を64個搭載した「サン・エンタープライズ10000サーバー」(通称・スターファイヤー)で、プロセッサー当たり8メガバイトのキャッシュメモリーと64ギガバイトのメインメモリーを備えている。

 ソフトウエアのLASSAPは、巨大なシーケンスを解析するために開発されたもので、1998年6月に第1号ユーザーとしてジェノスコープセンターが導入した。インターネット/イントラネット上の遺伝子・アミノ酸などのデータベースを大量かつ高速に検索することができ、ウェブブラウザーから簡単に利用することが可能。

 今回、ジェノスコープセンターは新しい“EXOFISH遺伝子予測法”を使用し、既知のヒトの全DNAをフグのゲノムの30%と比較した。この計算はBLASTホモロジー検索による720億回のたん白質/たん白質比較を行うことを意味していたが、2日たらずですべての処理を完了したという。

 LASSAPから利用できるこのようなスミス・ウォーターマン法のアルゴリズムは、サンのプラットホームに最適化されており、並列処理の高度なスケーラビリティーを実現している。例えば、SwissPROTの全たん白質データベースを対象にした5,017アミノ酸残基のたん白質スキャンで、毎秒32億マトリックスセルの性能を発揮したことがあるという。

 バイオインフォマティクスは、遺伝子シーケンシングのための主要コンポーネントであり、テーラーメードの医薬や治療を可能にするファーマコジェノミックス領域のキーになる技術として注目されている。