ニューラル機械翻訳+ポストエディットの需要増

近年急速に開発が進むニューラル機械翻訳(NMT)は、すでに翻訳およびローカリゼーション業界に変革をもたらしていますが、今後数年間はこの動きが加速すると見られています。人工知能(AI)および機械学習モデルに膨大な翻訳データセットを取り込むことにより、NMTの翻訳精度は飛躍的に向上しました。最近では、NMTの訳文を人間が編集( ポストエディット )することで、最終的な訳文の品質をさらに向上させる手法の需要が高まっています。

機械翻訳の種類

機械翻訳は、いくつかの段階を経てNMTに到達してきました。以下が主な機械翻訳の種類です。

  • ルールベース機械翻訳(RBMT:Rule Based Machine Translation)
  •  登録された文法ルールと辞書情報に基づき、ソース言語の構文を解釈してターゲット言語に翻訳する方法。
  • 統計的機械翻訳(SMT:Statistical Base Machine Translation)
  •  コーパスと呼ばれる大量の対訳データに基づき、統計モデルを使用して翻訳する方法。
  • ハイブリッド機械翻訳(HMT:Hybrid Machine Translation)
  •  RBMTとSMTを組み合わせて訳文を作成する方法。
  • ニューラル機械翻訳(NMT:Neural Machine Translation)
  •  ニューラルネットワーク、ディープラーニング(深層学習)を活用した方法。人の脳神経細胞の活動を単純化したモデルを採用し、収集した大量のデータを学習・分析させることで、より文脈的に正確な翻訳を生成できるようになった。ソース言語とターゲット言語のデータを蓄積させることで、人の翻訳者が作成する訳文に近い翻訳が実現するようになっている。

機械翻訳の活用により、翻訳スピードは年々早くなってきました。NMTの登場で翻訳速度は格段に速くなり、今後も生産性および効率の向上が期待できます。ビジネスのグローバル化が進み、大量のドキュメントや情報を短期間で翻訳しなければならないような状況において、機械翻訳の導入は選択肢のひとつとなっているのです。

NMTとポストエディットの組み合わせ

NMTの翻訳精度が高まっているとは言え、いまだにすべてを機械翻訳だけで済ませられないことも多々あります。そこで登場したのが、NMTの訳文を編集するポストエディット。専門的なスキルを持つ人間の翻訳者が機械翻訳の作成した訳文を見直し、特定の文化、地域、言語、または専門分野に適した表現に修正・編集し、ターゲット言語として最適な訳文に仕上げます。機械翻訳の性能が向上し、その利用が広がるにつれ、ポストエディットの需要も伸びつつあるのが現状です。

ポストエディトには2つのレベルがあり、最終的に求める訳文のレベル(目的)に応じたポストエディットを選択することで効率化を図ることも可能です。

●ライトポストエディット
主に、ターゲット言語でも文章の意味が通じるレベルにすることを目的とした修正。
●フルポストエディット
文体やスタイルまでも含めた高品質なレベルへの修正。コンテンツがターゲット言語でも正確で理解しやすく、適切な表現になるようにする。品質レベルとしては、翻訳者による翻訳作業と同等とされる。

機械翻訳+ポストエディットをより効率的に行うために

機械翻訳の出力結果によってポストエディットに要する時間と手間が変わることもありますが、機械翻訳とポストエディットを組み合わせることで、よりよい翻訳にすることが可能です。より効率的にポストエディットを行うために注意事項を以下に示します。

●用語管理に注意する
用語管理は、用語を正確に翻訳するために重要です。製品、顧客、または会社独自の用語を保存しておくことにより、固有の専門用語の訳語を統一することができます。逆に、翻訳すべきではない単語を特定しておくことも可能です。コンピュータ翻訳支援(CAT)ツールを使って翻訳プロジェクトで利用する用語をデータベース化すれば、翻訳作業のスピードアップと生産性向上につながります。

●翻訳管理システムを活用する
翻訳プロジェクトで発生する業務や案件管理を効率化する翻訳管理システム(TMS)を活用することで、スケジュールの管理などの手間を削減することができます。仕様や機能の異なるさまざまなTMSがありますが、複雑な翻訳プロジェクトの管理を一元化するのに役立ちます。翻訳プロジェクトによっては、複数の翻訳者やプロジェクト管理者が連携して作業する必要があるため、TMSを活用すれば効率的な管理が可能になります。

●翻訳メモリを使用する
多くの場合TMSは翻訳メモリを含む言語資産を統合して管理することができるようになっています。翻訳メモリとは、過去に翻訳した文(フラグメントやフレーズ)、段落、分節の原文(ソース言語)と訳文(ターゲット言語)を一対としてデータベース化するもので、過去に訳したテキストを繰り返し利用できるようにすることで翻訳作業を支援するツールです。機械翻訳とは異なり、翻訳者による訳語・訳文を保存・再利用するものです。特に、専門用語や反復フレーズが多く含まれる技術文書などの翻訳やローカライズ作業に役立ちます。

Googleなどの大企業は、早くからNMTを取り入れてきました。ソース言語とターゲット言語の両言語におけるデータを収集し、それらを使ったディープラーニングの効果を生かせば、NMTがいかに高品質な翻訳を作成できるかを見てきたからです。実際、現在のNMTはビジネスでも「使える」と感じる人が増えています。一方、やはりまだ人の手の介入が求められてもおり、言語サービス業界の情報サイト「Slator」がまとめた調査結果には、言語学者が行った調査でも、人間によるポストエディットを要求しているクライアントの数が大幅に増加していることが示されていました。

最高の訳文をスピーディーかつ、高いコストパフォーマンスで提供するためには、NMTと人間、お互いの強みを生かした機械翻訳+ポストエディットの組み合わせの需要がますます増えていくことが予想されます。

クリムゾンインタラクティブによる機械翻訳+ポストエディットサービスは、こちらをご覧ください。

Leave A Reply

Your email address will not be published.

お気軽にお問い合わせください

toiawase@crimsonjapan.co.jp