CCS特集2023年冬:化学情報協会

機械翻訳サービスを刷新、カスタマイズで精度が向上

 2023.12.05−化学情報協会(JAICI)は、化学物質表記に強く、科学技術論文や特許に最適な機械翻訳サービスを提供。中国語などさまざまな言語に対応し、正確でわかりやすい翻訳ができることで高い評価を得ている。

 JAICIの機械翻訳は、長年培ってきたノウハウをもとに、化合物名や科学技術専門用語を網羅したシソーラス付き対訳辞書、独自に整備した化合物表記翻訳技術を活用している。具体的なサービスとして、特許・文献の読解にフォーカスした「JAICI AutoTrans」、きちんとした翻訳文書に仕上げることを目的とした「JAICI ProTranslator」の2つがある。このうち、ProTranslatorが12月にバージョンアップされ、名称も「JAICI ProTranslator EXPRESS-Light」としてリニューアルされる。

 高品質な機械翻訳を下訳とし、人手で仕上げる訳文編集機能付き機械翻訳サービスであるという基本的な機能は同じだが、コンピューター支援翻訳(CAT)ツールの更新、翻訳精度を高めるカスタマイズ機能、テキスト化されていない古い文書にも対応できるOCR変換機能など、利用者のフィードバックに基づく改善が施されている。ウェブブラウザーから特許番号あるいは翻訳したいファイルを送信することにより、元の文書と図表などが同一にレイアウトされた訳文を数分から1時間程度で受け取ることができる。

 翻訳は、外国語と日本語との双方向で、英日、中日(簡体字・繁体字)、韓日のほか、欧州圏ではフランス語、ドイツ語、スペイン語、ポルトガル語、イタリア語、オランダ語、ポーランド語、ロシア語、アジア圏ではインドネシア語、タイ語、ミャンマー語、ベトナム語にも対応。独自の化合物認識ロジックと化合物表記辞書を利用した化合物表記翻訳機能は、英日、中日、日英に対応しており、通常のウェブ翻訳では誤りやすい化合物名も高精度に翻訳する。

 CATツールは、プロも使用している「memoQ」をサポートしており、ブラウザー上で原文と訳文を見比べ、原文レイアウトを確認しながら訳文テキストを編集することが可能。翻訳エンジンは文献向けと特許向けの2種類を自動的に使い分け、高品質の訳文が得られる仕組みとなっている。また、新しいOCR変換機能により、イメージ式のPDFファイルをワードファイルに変換することが可能。文書中の表も、ワードのテーブルに変換されるので、表内の数値もテキスト化される。

 とくに、注目されるのはカスタマイズ機能である。社名や商品名などの用語を統一する「用語ベース」(用語集)、定型文が同じ表現になるように登録しておく「翻訳メモリー」、機械翻訳を人手で修正した結果を学習させて自社専用の翻訳エンジンを育てる「アダプテーション」−の3つの機能を備えている。CATツールを使用した編集時に手を加えた点を自動的に登録・反映させる設定も可能で、使うほどに機械翻訳の完成度が高まっていく。アダプテーションで学習させた翻訳エンジンを使うと、文献向けと特許向けに加えて3種類のエンジンを同時に使用し、スコアの高い訳文を自動的に採用して文章を組み立てることができる。

 料金は、初期費用なしの年間契約で、月額9,500円から。全メニューを使用できる2週間の無料トライアルが可能となっている。


ニュースファイルのトップに戻る