Appierのミン・スン氏がNLPの最新動向を解説

新型コロナ研究や音声認識で発展、スクリーニング速度5万倍に

 2021.03.02−Appierは2月26日、データAIサイエンティストのミン・スン氏によるプレス向けセミナーを開催した。とくに、自然言語処理(NLP)に関する最近の研究動向を取り上げ、新型コロナウイルス感染症の治療薬開発への適用が進んでいること、今後音声認識の実用化で大きな進歩があることなどを論じた。

 新型コロナウイルスとの戦いには、人工知能(AI)を応用したNLPが活躍している。まずは通常のテキストデータの解析で、毎日のように数多く発表される研究論文をビッグデータ分析するのに利用されている。また、SNS上などには新型コロナに関するフェイクニュースも多いが、そのファクトチェックにもNLPが有効だという。

 また、ウイルスを構成するタンパク質のアミノ酸配列を“言語”とみなすことにより、NLPの対象とすることが可能。「アミノ酸配列のそれぞれのアミノ酸を文字に置き換えれば、アミノ酸配列データ全体を文字列として扱うことができる。AlphaFold2は、アミノ酸配列からタンパク質の折りたたみ(立体構造)を予測することができるし、新型コロナウイルスの新たな突然変異を予測するAIもある」とミン・スン氏。

 続けて、さきごろ、米国エネルギー省(DOE)のアルゴンヌ国立研究所などが開発した「IMPECCABLE」(インペッカブル)を紹介した。これは、新型コロナウイルス感染症の治療薬候補物質を発見するためのスクリーニングシステムで、従来の手法に比べて最高5万倍の速度で化合物を評価できるという。1日に数十億化合物を処理する能力がある。具体的には、X線解析で数千のタンパク質結晶から収集した複合体データを利用し、数十億の分子の基本的な特性を計算、特定の分子が既知のウイルスタンパク質と結合する可能性を予測できる機械学習モデルを作成する。そして、最も有望な化合物群をコンピューターシミュレーションにかけて精密に解析する。これによって得られた知見は、薬剤設計者と開発者に提供されるという。

                ◇       ◇       ◇

 次に、ミン・スン氏はNLPが音声認識分野で発達するという展望を示した。昨年、1,000億を超えるパラメーターを扱える大規模言語モデルGPT-3が注目されたが、今年になってその6倍以上である兆レベルのパラメーターに対応したSwitch Transformerが登場していることを紹介。学習コストや提供コストを抑制する努力が払われ、今後1〜3年で言語の理解や生成能力が大きく進歩するとした。

 とくに、音声データの文字起こしは、英語・中国語・日本語などの主要言語ではそれなりに成熟してきているが、長尺音声では5〜10%のエラーが出るほか、マイナーな言語への対応は進んでいない。「昨年、新型コロナの巣ごもり需要で、長尺の音声コンテンツが人気になった。Clubhouseなどの会話型SNSがヒットし、日本でのサービスも増えている」とミン・スン氏。音声データが増加しており、これをどう活用するかがビジネス上のポイントになると述べる。

 GPT-3やSwitch Transformerなどで利用できる“自己教師あり学習”がこの分野でも有効だという。入力用の音声ファイルからアノテーションなしで教師用データを抽出できるが、文字列であればすぐに意味を理解できるところ、音声は生データをサンプリングし、音素に分解、音節を特定して、単語に結びつけていくという手間が加わる。もともとが連続性を持った長尺の音声であり、データポイントが膨大になる上、このような複雑な階層構造があるため、簡単にはいかない。

 しかし、AI技術の進歩は早く、1〜3年で長尺音声の文字起こしが可能になると予測している。「音声データを直接検索したり、SNS音声でトレンド分析するようなこともできるだろう。リモート会議中の音声を加工し、プロのアナウンサーのような美声にしたり、ものを食べている咀しゃく音をカットしたりするサービスも出てくると思う」とした。

******

<関連リンク>:

Appier(トップページ)
https://www.appier.com/ja/

HospiMedia(IMPECCABLEのニュース)
https://www.hospimedica.com/covid-19/articles/294787039/novel-pipeline-of-ai-and-simulation-tools-could-make-process-of-screening-drug-candidates-for-covid-19-50000-times-faster.html


ニュースファイルのトップに戻る