CCS特集第3部:バイオインフォマティクス

遺伝子/たん白質のネットワーク解析で高まるゲノム創薬

 2001.11.31−遺伝子の研究が進み、ポストゲノムの時代に本格的に突入したことで、新薬の研究開発にも革新が生じつつある。遺伝子からターゲットを発見し、相手の構造や機能、薬物としての作用機構を科学的に明らかにしたうえで、それにかなった薬物を設計するという本当の意味での“合理的創薬”に向けてのシナリオらしきものが描かれつつあるからだ。実際には今後乗り越えなければならない研究課題や技術課題が山積しているが、それらをクリアするためにもやはりIT(情報技術)の手助けが必要であり、今後もますます新しい技術や発想を盛り込んだCCS開発が要望されていくだろう。

  ◇  ◇  ◇

 DNAの塩基配列の解読はさまざまな生物種において急速に進行しており、昨年にはヒトゲノムもドラフト配列が決定された。これは、アデニン(A)、チミン(T)、グアニン(G)、シトシン(C)の4種類の塩基化合物の組み合わせで構成されており、ヒトではこれが約30億塩基対のサイズとなっている。この塩基配列の順序がいわゆる“生命体の基本設計図”である。

 塩基配列全体は、エクソンとイントロンと呼ばれる部分から構成されている。このエクソンの部分の遺伝情報が複製され、それをもとにメッセンジャーRNA(mRNA)を介して細胞内でアミノ酸が正しい配列で各種のたん白質へと組み上げられていく。つまり、エクソンが一つあるいは複数集まって遺伝子として機能するわけだ。このため、エクソンは“たん白質の設計図”とも呼ばれる。

 生体内では、10数万種類のたん白質が働いているといわれる。以前は、これらに対応する遺伝子があるはずだという前提のもとに、ヒトの遺伝子数を10万程度だと推定していた。しかし、昨年のドラフト配列決定の結果、遺伝子の数は3万程度だと考えられるようになってきた。それによって重要になったのが“遺伝子のネットワーク”の解析である。3万の遺伝子が10数万のたん白質をつくり出すためには、遺伝子間の複雑なネットワークが相互に連関し合っていると考えざるをえないためだ。

 人間をはじめとするあらゆる生物の生命現象・生命活動はすべて何らかのたん白質の働きの結果である。例えば、病気になって熱が出たり、どこかが痛くなったりするのも結局はたん白質の働きの結果としてあらわれる現象ということになる。その意味では、遺伝子の相互作用、たん白質の相互作用のネットワークを解明することが、ポストゲノムの大きなテーマだといっても過言ではないだろう。学問的には、そのネットワークのすべてを詳細に把握し、生命の神秘を完全に解き明かすことが最終的な目標になる。しかし、産業的には、とくに病気に関連する遺伝子やたん白質のネットワークに焦点を絞ることで、新薬開発やいわゆるオーダーメード医療に役立てることが目的となる。

 具体的には、病気に直接関連するたん白質の働きをさまたげたり助けたりすることが医薬品の役割である。つまり、ターゲットのたん白質に結合できる物理化学的性質を持つ化合物が、医薬の候補化合物だということになる。

 ところで、塩基配列の中からエクソン領域をみつけ出すことはそう難しいことではない。ATGCの配列のなかで特定のパターンを持つ“開始コドン”と“終止コドン”にはさまれた領域がエクソンであるからだ。長大な塩基配列の中から特定のコドン配列をみつけ出すのは人間には無理だが、コンピューターには容易な作業である。文字列解析、言語処理の技術の応用ということになる。エクソン部分の配列は“コドン表”に照らしてアミノ酸配列に翻訳することができる。3つの塩基対が1つのアミノ酸に対応しており、これもコンピューターで簡単に変換させることができる。すでに、エクソンに対応した部分だけを集めたcDNAデータベースが着々と整備されつつある。

 ただ、こうしたアミノ酸配列だけではそのたん白質についての情報としては不十分で、やはり立体構造を求める必要がある。巨大分子であるたん白質の立体構造がわからなければ、医薬分子が結合できる活性部位を見いだすことができないからだ。さらには、たん白質の電子構造を知って、その化学的性質や反応性を確かめることも重要になる。

 アミノ酸配列(二次構造)から立体構造(三次構造)を予測する技術もここへ来て研究が活発になっている。国際的なたん白質立体構造予測コンテスト「CASP」の第4回大会が昨年12月にカリフォルニアで開催された。2年に1度の大会だが、最近では新しい予測手法の競演で盛り上がっているようだ。

 二次構造がわかっていれば、分子動力学法で安定構造を時間追跡することも可能だが、現状では不可能に近い。分子動力学法はフェムト秒単位での分子の時間変化をシミュレーションする技術で、ようやく数ナノ秒までの計算が可能になったばかりである。たん白質は長いアミノ酸配列が複雑に折り畳まれた立体配座を取るので、そこまでシミュレーションするにはミリ秒までの計算が必要になってしまう。現在の100万倍の計算速度が要求される。

 このため、立体構造が既知のたん白質の二次構造との類似性を比較することによって予測する“ホモロジー法”が現在でも主流だが、最近では部分的に計算を行ったり、既知の情報で計算を補完したりするなどの野心的方法も増えてきているようだ。いずれの手法にしても、もはやコンピューターを抜きにして立体構造予測を語ることはできない。

 一方で、NMRやX線を使った実験的なたん白質の構造決定が急ピッチで進められている。現在はまだ数100のオーダーだが、3,000−1万種が決まれば、代表的な構造パターンをほぼ網羅できることになるといわれている。そうなれば、残りのたん白質はコンピューターによるホモロジーモデリングで一気に決められるという読みである。これらは、構造ゲノミクスと呼ばれる研究領域に当たる。

 このように、塩基配列の解読だけに集中していた20世紀に対し、遺伝子ネットワーク解析、SNPs解析、構造ゲノミクス、ゲノム比較など複数の研究領域が関連し合いながら同時発展するのが21世紀のポストゲノム時代だといえるだろう。

 新薬開発を対象にすると、さまざまな病気を遺伝子のネットワークとして解明し、モデル化することが必要になる。それには病気の原因となる遺伝子やたん白質を発見することも含まれる。さらには、ターゲットとなるたん白質が決まったらその立体構造を解明し、それに合わせて薬物分子を設計するのである。ここに至れば、コンビナトリアルケミストリーからハイスループットスクリーニング(HTS)、ADME(吸収・分布・代謝・排出)/毒性予測、分子シミュレーション/モデリングといった既存のCCS技術との統合の道もみえてくるだろう。

 こう書くと、いかにも簡単そうだが、実際にはかなりの困難が予想され、新しい時代の統合CCS技術の確立に今後10年を要するとしても意外とはいえないであろう。ただ確実なことは、こうしたゲノム創薬のどこを取ってもコンピューターと無縁ではいられないということだ。21世紀に全人類が目指すべきことは、平和と安全、健康で豊かな生活である。その意味で、CCSの重要性が将来にわたって失われることはないだろう。