NECと京大・宇高助教授らが高効率バーチャルスクリーニング技術

特定のMHC分子に結合性の強いペプチドアミノ酸配列を予測

 2001.06.26−NECは25日、経済産業省のリアルワールドコンピューティングプロジェクト(RWC)の一貫で、京都大学理学部の宇高恵子助教授らのグループと共同で、癌やエイズなどに効果があるペプチド系医薬品の候補物質のスクリーニング工程を大幅に高速化する技術を開発したと発表した。ウイルスに感染したことを免疫機構に伝達する役割を担うMHC分子を研究対象とし、それに結合しやすいペプチドのアミノ酸配列を高精度に予測することに成功したもの。従来の実験的方法では、数%から30%程度の予測率しか達成できなかったが、今回の新手法では70−80%という予測精度を実現した。同プロジェクトは最終年度に入っており、NECでは来年度には事業化につなげたいとしている。

 今回の研究は、NECインターネットシステム研究所と京都大学・宇高助教授(理学部生物物理学教室)らのグループが共同で行ったもの。人体が癌やC型肝炎、エイズなどの慢性ウイルス疾患に感染すると、感染した細胞内でウイルスの断片がペプチドとなってMHC(主要組織適合性複合体)分子に結合して細胞表面にあらわれ(抗原提示)、それに刺激されてキラーT細胞が感染した細胞を攻撃し、その増殖を食い止めるというメカニズムが働く。このペプチドをワクチンとして投与することにより、キラーT細胞を活性化・増殖させ、病気の治療に役立てようというのがペプチドワクチンの基本的な考え方である。

 しかし、MHC分子は個人差があって代表的なものでも10種類ほどがあり、ペプチドも数千種類が存在。このため、感染細胞内で大量に発現されるペプチドで、しかもその患者が持つ特定のMHC分子に結合しやすいペプチドであり、さらに反応性の高いキラーT細胞が存在しているというペプチドをみつけ出す必要がある。研究室で1年間に実験できるペプチドは200種類ほどであり、こうした条件にかなうペプチドをいかに効率よく探索するかが大きな問題となっていた。

 今回、NECが開発したのは学習機械を用いた“能動学習法”と呼ばれるアルゴリズムを応用したもの。システムの中には50台の学習機械がソフトウエアとして組み込まれており、これに宇高助教授らが行った実験結果を学習させた。特定のペプチドのアミノ酸配列のMHC分子に対する結合能を数値で表現し、初期データとして180例の実験データを入力した。このとき、学習機械はそれぞれ異なるデータをサンプリングしてそれぞれに異なる予測ルールを生成している。

 これらの学習機械群に対し、未知のアミノ酸配列を持つペプチドの結合能を予測させ、その結果が割れた場合、そのペプチドを実際に合成して実験にかけ、データを測定して学習セットとして与えるという作業を繰り返した。こうして新たに180例の実験を実施し、共通の予測ルールを総合的に導き出していった。

 このシステムを使ってMHC分子との結合能が高いアミノ酸配列を新たに予測させたところ、70−80%の確率で実際に結合能の高い配列を提示することができた。今回のターゲットはアミノ酸が9個からなるペプチドであり、全部の組み合わせは5,000億種類となるが、そのなかから実際に約80個の癌ワクチン候補ペプチドを得たとしている。研究グループでは、この候補を用いて動物実験フェーズに進む一方、異なるMHC分子に対しても同様にペプチド探索を行い、最終的には特定の抗原に対するT細胞を積極的に誘導したり、逆に自己免疫疾患を起こすT細胞のみを特異的に抑制したりする医薬品開発に役立つ総合ペプチドデータベースを構築していく計画である。

 宇高助教授は、「これまでにもニューラルネットワークを使って予測する研究があったが、これではペプチドとMHC分子との結合の強さが0か1かという表現しかできなかった。今回はその結合能を連続的な数値で表現できていることも大きいと思う。いろいろなMHC分子にどのようなアミノ酸配列のペプチドが結合しやすいかがわかっていれば、今後ポストゲノムでたん白質の解析が進んだときに、新薬のターゲットを瞬時にみつけ出すことが可能になる。A24型とA11型のMHC型を持っている患者さんにはこれだという形で、オーダーメード的な医療の実現にもつながると期待される」と話している。