CCS特集2017年冬:化学情報協会
機械翻訳で特許調査を支援、3種のサービスを提供
2017.12.05−化学情報協会(JAICI)は、「化学情報を通して日本の,そして世界の科学技術の発展に貢献する」というミッションのもと、とくに化学分野における高品質なデータベースサービスを提供。統合型データベース検索ツール「STN」や研究者向けの「SciFinder」をはじめ、結晶構造・質量スペクトルなど研究開発を支援する各種データベース・ソフトの提供も行っている。そうした中で蓄積してきた化合物辞書技術を生かし、新たなサービスとして来年1月から「高精度機械翻訳を活用した外国特許調査支援サービス」を開始する。
企業にとって特許調査は必要だが手間のかかる仕事で、とくに英語・中国語などの特許・論文が増加の一途をたどる中、それらの内容を日本語で手早く理解したいというニーズが大きくなっている。ただ、ウェブ上などで利用できる機械翻訳は複雑な化合物名の訳は苦手で、一部が抜けたり訳せなかったりする場合が多い。
今回の新サービスでは、情報通信研究機構(NICT)が開発している統計的機械翻訳エンジンを採用し、実際に特許の文章(英日3億5,000万文対)を学習させることで、特許翻訳に最適化した。また、特許原文をあらかじめ編集し、長い文章を短く分割したり、箇条書き部分が崩れないようにしたり、数値抜けを防ぐ事前策を講じたりするなどの工夫を加えている。
具体的なサービスとしては、外国特許の特許番号を直接入力して、原文およびその翻訳結果を得る「PatSpread翻訳」、STN/SciFinderで特許検索を行い、その検索結果ファイルをアップロードして、翻訳結果をダウンロードする「ファイル翻訳」、ブラウザーに任意のテキストを貼り付けて翻訳結果をオンデマンドで得る「テキスト翻訳」−の3種類を用意している。
会員になって利用することができ、年間利用の一般会員と、月額課金の従量会員を選択可能。年間会員は48万円(5 ID)で、従量会員(例えばPatSpreadの全文翻訳は1件2,400円、テキスト翻訳は1回200円、ファイル翻訳は利用不可)は使っただけの支払いとなる。
同協会ではすでにトライアル(2週間)を受付中。来年1月から正式サービスとなり、まずは英日翻訳機能を提供、4月から中日翻訳にも対応する。また、深層学習を利用したニューラル機械翻訳(NMT)を導入するほか、特許だけでなく科学技術論文の翻訳にも対応する準備も進めている。