CCS特集2023年冬:総論第3部 バイオインフォマティクス

大量処理でヒトゲノム解読に貢献、糖鎖の全容解明へ新プロジェクト

 2023.10.03−バイオインフォマティクスは、生命科学研究の重要なツールであり、かつてのヒトゲノムプロジェクトでも大きな役割を果たした。近年では、次世代シーケンサー(NGS)の登場によって実験から得られるデータ量が莫大なサイズとなっており、バイオインフォマティクスツールの助けなしにデータを解析することは不可能。解析対象も、遺伝子から転写産物、タンパク質、代謝物へと広がり、設計図としてのヒトゲノムを具体的な医療などに応用することを目的に、オミックス研究が隆盛をきわめている。これに関わるデータも大量で、ソフトウエアの支援が不可欠となっている。

 ヒトゲノムプロジェクトは、米エネルギー省(DOE)や米国立衛生研究所(NIH)の主導で1990年からスタート。欧州(英独仏)と日本もプロジェクトに参加し、2003年4月にはヒトゲノム30億塩基対のうち95%を99.99%以上の精度で解読完了したとの宣言が出された。正式なプロジェクト完了は2004年10月で、最終的には99%の領域がカバーされたが、今年をヒトゲノム解読完了から20周年として記念する動きもある。

 プロジェクトは2000年代に入って一気に加速したが、それはDNAシーケンサーの技術革新と、バイオインフォマティクスソフトウエアの発展が大きなカギとなった。とくに、プロジェクトの主要メンバーのひとりだったクレイグ・ベンダー博士が米セレーラ社を設立し、国際プロジェクトの向こうを張って、独自でのゲノム解読に乗り出したことが、いわば世界中を激震させた。セレーラ社は、当時の最新DNAシーケンサーを500台も大量導入。これは、アプライド・バイオシステムズ(ABI、現サーモフィッシャー・サイエンティフィック)のPRISM3700と呼ばれるキャピラリーアレイDNAシーケンサーで、コアになるシーズフロー方式は日立製作所の日本人研究者が開発した技術が採用されていた。セレーラはこれを利用することにより、国際プロジェクトよりも早く解読を進め、2000年6月にホワイトハウスでドラフトシーケンス解読発表を行っている。国際チームも同機を導入し巻き返しを図った。このことから、日本の技術がヒトゲノム解読を完了させたともいわれている。

 DNAシーケンサーは、それまでの手作業で職人芸的だった読み取りの世界を変化させ、圧倒的な精度とスループットをもたらした。出てくるデータ量が格段に大きいため、セレーラ社ではコンパック(現ヒューレット・パッカード・エンタープライズ)のコンピューターサーバーを100台単位で次々に購入し、ソフトウエアを並列かつ大規模に駆動させることでデータを処理した。当時、シーケンサーとサーバーに毎年3億ドルを投資していたといわれる。データを高速に処理できなければ解読は進まないわけで、その意味ではバイオインフォマティクスの貢献度は絶大だったといえよう。

 その後、生命科学研究は、ゲノムの解読から、それをベースとした応用の時代に入り、オミックス研究が主流となった。生命現象は、遺伝子が転写され、転写産物(トランスクリプトミクス)が翻訳されてタンパク質(プロテオミクス)になり、タンパク質は代謝物(メタボロミクス)との相互作用によって細胞の恒常性に大きく寄与する。細胞の機能や形態は表現型(フェノミクス)として観察される。また、医療や健康に関係するものとして、食事によって取り込まれた代謝物(フードミクス)、腸内細菌による代謝物(マイクロバイオミクス)も研究対象になっている。

 さらに、最近注目されているのが、人体を構成する37兆個といわれる細胞の表面すべてに存在する糖鎖の総体(グライコロテオミクス)である。核酸やタンパク質と並び、生命活動に欠かせない第3の生命鎖とされている。その糖鎖情報を世界に先駆けて網羅的に解読することを目指し、今年2月に東海国立大学機構(名古屋大学、岐阜大学)、自然科学研究機構ならびに創価大学が実施主体となって、「ヒューマングライコームプロジェクト」(HGA)が始動した。ヒト糖鎖の精密地図を作成し、さまざまな病気と糖鎖との関係を明らかにしていく。このためには大規模な実験が数多く行われ、大量のデータを処理・解析するためにバイオインフォマティクスが大いに活躍することになるだろう。

 生命科学において、ヒトゲノムプロジェクトでの日本の貢献は大きかったが、その後はNGS開発で決定的な後れを取り、ソフトウエア開発でも欧米の後塵を拝してきた。とくにこの十数年、欧米ではバイオインフォマティクスのソフトウエアベンダーが多く誕生し、生命科学の最先端研究を支援している。日本発の技術が世界をリードする時代の再来を期待したい。


ニュースファイルのトップに戻る