NTTデータがバイオ分野でグリッド事業化へのベータプロジェクト

慶應義塾大学および東亜合成と共同、一般PCユーザーの参加募る

 2005.02.19−NTTデータは、一般のパソコンユーザーの参加を募るかたちでのグリッドコンピューティング事業化に向けてのベータプロジェクト「セルコンピューティング・バース」を16日からスタートした。慶應義塾大学および東亜合成とそれぞれ共同して、自然免疫系遺伝子領域解明およびヒトゲノム染色体間の法則性解明を目指すバイオ分野の大規模計算を開始したもの。参加方法は、専用のメンバーソフトをダウンロードしてインストールし、参加登録するだけ。参加者への特典として、自分のパソコンがプロジェクトに貢献した計算量に応じて得られるポイントをキャラクターコミュニティ「セルタウン」で利用することができる。

 NTTデータは、グリッドコンピューティング製品「セルコンピューティング」(商品名)をイントラネット環境で利用する企業向けに販売しているが、今回の「バース」プロジェクトは、インターネット環境で一般ユーザーのパソコン資産を借りて、大規模な科学技術計算を実行しようというもの。まずは、2つのプロジェクトを実施するが、さらに新しいプロジェクトを発足させる計画もある。

 まず、慶應義塾大学医学部分子生物教室の清水信義教授らの研究グループと立ち上げたのが「ゲノムスーパーパワーをみつけよう! 自然免疫系遺伝子領域解明プロジェクト BOLERO+」。これは、自然免疫の主な成分として生物種を越えて認められる抗菌ペプチド“デフェンシン”に注目し、生体防御のための何らかの共通の特徴を洗い出すことを目的としている。

 細菌などによる感染の際、生体はデフェンシン遺伝子を優先的に発現させることによって、抗菌力のあるデフェンシンを分泌するという。プロジェクトBOLERO+では、デフェンシン遺伝子を取り巻くDNA領域(30万塩基)と、脊椎動物(ヒト、マウス、ラット、メダカ)、無脊椎動物(ハエ)、植物(シロイヌナズナ)における類似度をスコア化し、解析することを行う。このためのプログラムは「LATEEN+」と呼ばれ、参加者のパソコン内で分散して計算が実行されることになる。

 もう1つのプロジェクトは、東亜合成名古屋研究機構新製品開発研究所の吉田徹彦主席研究員らのグループとの「ゲノムのパズルを解こう! ヒトゲノム染色体間法則性解明プロジェクト CHRONOS」である。遺伝子病解明などにも貢献しうる基礎データを得ることを目的に、ヒトゲノム染色体間の並びの本質とは何かということに対して挑戦していくという。ヒトゲノム染色体24本の順列(24の階乗=6.20448402×10の23乗)の中に周期性が高いものがあるかどうかを調べる。

 具体的には、ヒトゲノム染色体上の非常に類似した重複領域にはさまれた大きなホットスポット領域169カ所(この内の24カ所が遺伝子病と関連があるとされる)に注目。ホットスポット領域と非ホットスポット領域をそれぞれ染色体ごとに区分(ヒトゲノム全体を6万5,536の単位に分割)したデータをもとに、ヒトゲノム染色体24本を並び替えて1本のひものように連結した状態でホットスポット領域間の法則性(周期性)を探索していく。専用プログラムは「Motty」と呼ばれ、染色体24本の順列(24の階乗)を作成し、それぞれの順列データごとに高速フーリエ変換処理を行って、最も周期性の高い順列を24の階乗の中から見つけ出すというもの。

 今回の両プロジェクトにおいては、“SETI@home”などでも利用されたオープンソースソフトの「BOINC」を基盤にし、それぞれで使われるアプリケーションの移植などの開発をNTTデータが担当した。

 プロジェクトに参加したい人は、専用サイト(http://www.cellcomputing.net)に接続してメンバー登録し、ソフトをダウンロード(ファイルサイズは1.32MB)してインストールする必要がある。対象OSはWindows2000/XP。プロジェクトへの参加者はコミュニティウェブサイト「セルタウン」の中で好きなキャラクターをつくり、家を持ったり、さまざまなアイテムを購入したりして、参加者同士でのコミュニケーションを楽しむことができる。