富士通研究所らがタンパク質間の生物化学反応を予測する新技術
リン酸化反応の連鎖情報を利用、従来型AIの2倍の反応を予測
2018.11.01−富士通研究所は31日、アイルランドの研究機関であるThe Insight Centre for Data Analytics およびFujitsu Ireland との共同研究として、タンパク質間のリン酸化反応を予測する新たな技術を開発したと発表した。通常の人工知能(AI)的な手法では予測できなかった未知の化学反応を2倍以上みつけることができたという。リン酸化反応と遺伝子疾患とのメカニズム解明に道をつけるもので、創薬研究での活用や精密医療への応用も期待できるとしている。
細胞内のさまざまなタンパク質が化学反応を通じて情報をやり取りすることで生命機能が維持されているが、がんなどの疾患の多くはタンパク質間のリン酸化反応(タンパク質を構成するアミノ酸に、別のタンパク質によってリン酸基が付与される反応)の異常に原因があることが最近の研究でわかってきている。このため、リン酸化反応の異常を修復する医薬品が開発されれば、より効果的な治療が可能となるが、現在判明しているリン酸化反応はまだ少なく、未知のリン酸化反応の発見と、その反応データの充実が急がれている。ただ、タンパク質の組み合わせだけでも80万通り以上あり、生物学実験には膨大な時間と費用がかかることから、あらかじめ確度の高い組み合わせを予測したいというニーズが高かった。
リン酸化反応は、タンパク質のアミノ酸配列に依存することが知られており、既知のリン酸化反応に関係するアミノ酸配列の構造情報を学習させることで、未知のリン酸化反応を予測するAI技術がすでに利用されている。今回の共同研究は、リン酸化されたタンパク質が別のタンパク質を連鎖的にリン酸化するという新しい知見を組み込んだもので、アミノ酸配列の構造情報に加え、連鎖情報をナレッジグラフ(意味付けされたグラフ構造の知識ベース)で表現している。これに当たり、化学反応の複雑なパターンを、ナレッジグラフがとらえやすく高精度な予測結果を出すように最適化された属性にして表現しており(特許出願ずみ)、リン酸化反応のつながり(連鎖情報)に基づいてタンパク質間の関係を総合的にとらえることができる。これにより、未知の関係性も予測可能になる。
今回、この技術を利用し、評価用データ(リン酸化反応データベースPhosphoSitePlus、タンパク質配列データベースUniPro)を用いて、リン酸化反応9,802個を学習して新たなリン酸化反応を予測した結果、1,158万1,940個の反応が算出された。これは、従来型AIの予測より2倍多い数に当たる。さらに、アイルランドの生物学研究機関であるSystems Biology Irelandがこの情報を検証。がんに関するリン酸化反応の予測結果をいくつかピックアップして、質量分析装置と抗体を用いて検証実験を行ったところ、これまでの技術では予測できなかった8個を含む9個のリン酸化反応を実際に確認することができた。
今後の展開としては、今回予測したデータを活用することで、疾患原因(リン酸化反応の異常)から疾患発症までの化学反応の流れが把握できるようになり、創薬やがん治療などへの応用が期待されるという。また、富士通研究所では、生物医学データをナレッジグラフ上で処理するための研究をさらに進めるほか、富士通のAI技術「Zinrai」と組み合わせることによるビジネス展開も図っていく。
******
<関連リンク>:
富士通研究所(トップページ)
http://www.fujitsu.com/jp/group/labs/