化学情報協会が外国特許調査のための新サービス
機械翻訳で日本語訳を手軽に入手、3種の提供形態を用意
2017.11.29−化学情報協会(JAICI)は、化学物質情報、化学文献・特許などの情報提供サービスに長く携わってきたノウハウを生かし、高精度機械翻訳を活用した外国特許調査支援サービス「JAICI AutoTrans」を来年1月から開始する。英語・中国語などの特許・論文が増加の一途をたどる中、それらの内容を日本語で手早く理解したいというニーズが高まっている。機械翻訳ながら複雑な化合物名も正確に訳すことができ、数値が混じるなどの特許に特有の文章に対応するようにチューニングされていることが特徴だ。
「JAICI AutoTrans」は、情報通信研究機構(NICT)が開発している統計的機械翻訳エンジンを採用し、実際に特許の文章(英日3億5,000万文対)を学習させることで、特許翻訳に最適化した。また、特許原文をあらかじめ編集し、長い文章を短く分割したり、箇条書き部分が崩れないようにしたり、数値抜けを防ぐ事前策を講じたりするなどの工夫を加えている。
具体的なサービスとしては、外国特許(US、EP、WO)の特許番号を直接入力して、原文およびその翻訳結果を得る「PatSpread翻訳」、STNやSciFinderで特許検索を行い、その検索結果ファイルをアップロードして、翻訳結果をダウンロードする「ファイル翻訳」、ブラウザーに任意のテキストを貼り付けて翻訳結果をオンデマンドで得る「テキスト翻訳」−の3種類を用意している。
とくに、「PatSpread翻訳」は、特許全文あるいはフロント(書誌事項・代表図・要約・全請求項)の日本語訳が得られるもので、原報のレイアウトを保持しているため、特許原文と翻訳との比較が容易。また、「ファイル翻訳」では、利用者はSTN/SciFinderの検索結果を一覧表示できるエクセル形式で翻訳を取得できる。必要な情報が補完・加工・集約されているため、スクリーニングに役立つ。原文と和訳を隣り合ったセルで確認できるほか、第一請求項の英日対訳、化学式または代表図も表示される。物質情報と明細書を同一画面で確認できるようにするSTN/SciFinderのPatentPak機能へのリンク、原文フルテキストへのリンクも付されており、エクセル内から「PatSpread翻訳」への依頼を行うこともできる。最後の「テキスト翻訳」は汎用の外部翻訳エンジンをセキュアな環境で提供するもので、特許や化学論文に特化したチューニングはされていない。ただ、対応言語が多く、日本語を含む29ヵ国語を双方向に翻訳することが可能である。
「JAICI AutoTrans」は会員になって利用するサービスで、年間利用の一般会員と、月額課金の従量会員に分かれる。年間会員の料金は48万円(5ID)で、一定の利用上限までは定額。一方、従量会員は「PatSpread翻訳」の全文が1件2,400円など、使った分だけの支払いとなる。
JAICIではすでにトライアル(2週間)を受付中。来年1月から正式サービスとなり、まずは英日翻訳機能を提供、4月から中日翻訳にも対応する。また、深層学習を利用したニューラル機械翻訳(NMT)を導入するほか、特許だけでなく科学技術論文の翻訳にも対応する準備を進めている。
******
<関連リンク>:
化学情報協会(トップページ)
http://www.jaici.or.jp/
化学情報協会(JAICI AutoTrans 製品情報ページ)
http://www.jaici.or.jp/autotrans/index.html