化学情報協会が機械翻訳サービスに新メニュー
レイアウトを再現して文書を和訳、独自の化合物表記翻訳技術採用
2019.06.27−化学情報協会(JAICI)は、中国語/英語特許・文献調査支援サービス「JAICI AutoTrans」に新しいメニューを追加した。「DocSpread翻訳」と呼ばれ、PDF、Word、Excel、PowerPointの英語ファイルを和訳するサービス。文書中の図表、上付き/下付き文字、段落にまたがる文章の連結など、原文そのままのレイアウトを保ったままで翻訳される。とくに、化学系の論文・技術文書の翻訳に強いのが特徴。これにより、翻訳機能は全部で6種類となり、研究者らの幅広いニーズに応えることができるようになった。
「JAICI AutoTrans」は、昨年1月にスタートしたサービスで、情報通信研究機構(NICT)が開発しているニューラル機械翻訳エンジン(NMT)を採用し、特許を深層学習させた翻訳エンジンと、科学技術文献を学習させたエンジンとを使い分けることで翻訳品質を高めているほか、原文をあらかじめ編集し、長い文章を短く分割したり、箇条書き部分が崩れないようにしたり、数値抜けを防ぐ事前策を講じたりするなどの前編集プログラムを活用している。さらに、JAICI独自の化合物表記翻訳技術を導入しており、化合物名中に頻出するカンマやハイフンなど、一般的な機械翻訳が苦手とする表記を多数含んでいても、訳抜けやロカント崩れのない正確な翻訳が得られる。とくに、中国語(簡体字・繁体字)の化合物表記からの日本語訳はきわめて高い精度を誇るという。
「JAICI AutoTrans」はネット経由で注文すると日本語訳が納品されるサービス。大量の外国特許を効率良く読みたい、文献抄録や論文・技術文書をまとめて和訳したい、海外の提携先などからの英語資料を手早く訳したい、などのニーズに応えて好評を得ている。一つのユーザーIDで複数人が活用できる(同時アクセスは不可)ため、社内で共用利用しやすいことも特徴となっている。
既存の5種類のメニューを概観すると、まず「PatSpread翻訳」は、特許番号を指定することで、その特許全文と、同じレイアウトで仕上げた和訳全文を納品する。レイアウトを合わせているため原文と訳文の比較対照が容易で、エンドユーザーである研究者からの依頼が多い。発注した全特許の書誌情報の一覧をExcelファイルにまとめて提供していることも便利だと評価されている。さらに、STNやSciFinderで特許検索などを行い、その検索結果ファイルをアップロードして、翻訳結果をダウンロードする「ファイル翻訳」、ユーザーがExcelにまとめた抄録・文献一覧などのワークシートに和訳を付与(ワークシートに和訳列を挿入)する「汎用ワークシート翻訳」、一度に最大1,000行の翻訳に対応する「汎用ワークシート翻訳1000」、ブラウザーに任意のテキストを貼り付けて翻訳結果をオンデマンドで得る「テキスト翻訳」(英中を含めた29言語に対応)を提供している。
これらに加えた6番目のサービスメニューが今回の「DocSpread翻訳」で、論文や技術文書の翻訳に最適。JAICI化合物表記翻訳技術を採用しているため、化学系の文書を正確に訳出することが可能。対応できるファイル形式は、pdf、docx、pptx。現在は英日翻訳のみだが、順次複数言語方向に展開していく予定だ。原文書と訳文のレイアウトを揃えていることは「PatSpread翻訳」と同様で、図表や上付き/下付き文字、段落にまたがる文章の連結なども再現する。また、研究者向け情報検索ツールであるSciFinder-nの検索結果ファイル(英語)の翻訳に対応しているため、検索結果が大量になった場合も、日本語で全体を把握しやすくなる。効率アップ、時間短縮に役立つと期待される。
なお、「JAICI AutoTrans」の利用形態は、年間契約の一般会員と、月額課金の従量会員に分かれる。一般会員は1契約で五つのIDが与えられ、一定の利用上限までは定額。ユーザーIDにはメールアドレスを指定できるが、納品先のメールアドレスをその都度変えられるため、一つのIDを複数人で共用することが可能だ。
******
<関連リンク>:
化学情報協会(AutoTrans 製品紹介ページ)
https://www.jaici.or.jp/autotrans/index.html
化学情報協会(SciFinder-n 製品紹介ページ)
https://www.jaici.or.jp/scifinder-n/