機械翻訳を補うポストエディット
機械翻訳は高性能かつ無料で利用できる選択肢も広がって普及が進んでいます。そこで、機械翻訳がご自身のニーズに適しているか、またそれを補うポストエディットが必要なのかを判断するために、クリムゾン・ジャパン(以下、クリムゾン)の「機械翻訳+ポストエディットサービス(MTPE)」を、人気の高い機械翻訳ツールの一つであるDeepLと比較してみました。
機械翻訳を補うポストエディット
外国語の文章の内容を簡単に把握したいときや、急いで訳文が必要なとき、翻訳者に依頼するほどコストをかけたくないとき―など状況はさまざまですが、翻訳手段のひとつとしてオンラインの機械翻訳ツールの利用が広がっています。今では、多くの人が機械翻訳ツールを日常的に使っていることでしょう。手軽に使える機械翻訳ツールには、短時間でコストをかけずに翻訳結果が得られるとのメリットがありますが、翻訳する必要のある内容によっては、正しく訳出されているかを慎重に確認することが重要です。
機械翻訳による訳文が正確で依頼者のニーズに適した文章になっているかを確認する手段としては、機械翻訳のポストエディット(MTPE)サービスの利用が挙げられます。(※MTPEはMachine Translation Post-Editingの略)
本記事では、人工知能システム開発を行うDeepL社が提供する機械翻訳サービス『DeepL』と翻訳会社クリムゾンが提供する機械翻訳+ポストエディット(MTPE)サービスを比較しつつ、MTPEの役割と重要性をまとめました。
機械翻訳とポストエディット。合わせてMTPE
まず、MTPEはMachine Translation Post-Editingの略で、Machine Translationが機械翻訳、Post-Editingは機械翻訳後の編集・校正(ポストエディット)を意味しており、MTPE自体に機械翻訳とポストエディットが含まれています。
機械翻訳(MT)とは、ある言語から別の言語への翻訳を、コンピュータや人工知能(AI)を用いて可能な限り自動で変換しようとするものです。使い方は非常に簡単で、ユーザーがソース言語とターゲット言語を選択し、そして翻訳するテキストをオンライン上の所定の箇所に入力するだけです。無料で基本的な翻訳ができるアプリもありますが、翻訳できる文字数の制限などがあるので、大規模な翻訳プロジェクトの場合は、分量や内容に応じて有料サービスを使うか、翻訳会社や言語サービスプロバイダー(LSP)に作業を依頼する方が無難です。
ポストエディット(PE)とは、人間の翻訳者が訳文を確認し、正確さをチェックするとともに、文化的背景やテーマにまつわる専門知識に基づき、訳し間違いや微妙なニュアンスの違いを修正する作業です。MTPEとは、機械翻訳された文章に対して翻訳者がポストエディットを行うものです。文字通り「機械的に」出力された機械翻訳の訳文に、「人間の目線で」見直しを加えることで、より精度の高い訳文にすることができます
DeepLとクリムゾンの「機械翻訳+ポストエディット」の比較
一例として、2つの機械翻訳サービスを簡単に比較してみます。
そもそも、この2つの機械翻訳を提供している会社の違いが、サービス内容にも反映されています。
ドイツのAI企業DeepL社が提供するニューラル機械翻訳サービス『DeepL』には、無料版と有料版があり、26言語に対応しています。無料版では1回に翻訳できる文字数が5000文字と制限がありますが、文章が短い場合は別の訳し方も表示されます。有料版のDeepL Proには文字制限がなく、3つのプランから選択が可能です。無料版・有料版のいずれにもポストエディット(PE)サービスはありません。
クリムゾンは、50以上の言語の翻訳とローカリゼーション・サービスを提供している翻訳会社の特徴を活かし、機械翻訳に加えて翻訳者によるポストエディット(合わせてMTPE )を提供しています。MTPEプランなら、専門的な内容の文章にも機械翻訳を利用することができ、翻訳精度の担保もできます。
クリムゾン「機械翻訳+ポストエディット(MTPE)」とDeepLの特徴を比較
特徴 | クリムゾン機械翻訳+ポストエディット(MTPE) | DeepL |
料金 | 100万文字につき3500円 MTPEの追加が可能(機械翻訳+MTPEは要見積)無料トライアルあり | 無料版あり 有料版は3プラン |
対応ファイル形式 | 1:Word(.docx) | 3:PDF、Word(.docx)、PowerPoint(.pptx) |
対応言語数 | 1(英語のみ) | 26(2022年4月時点) |
暗号化クラウドストレージ | あり | あり |
翻訳中の書式保存 | 可 | 可 |
デスクトップアプリ | あり | あり |
システムインテグレーション | あり | あり[ |
情報セキュリティ | ISO認証取得 | ISO認証取得 |
プロジェクト管理ダッシュボード | あり | なし |
CATツール | あり | Advancedと Ultimateプランのみ |
用語集の作成 | 可 | 可 |
翻訳メモリ | あり | 有料版は 訳文の保存が可能 |
MTPE(翻訳者による ポストエディット) | あり | なし |
機械翻訳のメリットとデメリット
機械翻訳のメリットはなんと言っても手軽さとコストでしょう。
- 手軽に利用できる
- 翻訳者に依頼するよりもコストと所要時間を抑えることができる
- 簡単な内容であればそれなりの精度の翻訳文書が出力されるので内容の把握ができる
一方で、機械翻訳では専門的な内容や複雑な文章の翻訳で正確性を確保するのが難しい場合も多く、細かいニュアンスや文化的な違いを配慮した翻訳が難しい場合もあります。機械翻訳を利用する際には、こうしたメリット・デメリットを踏まえておくことが大切です。
翻訳精度
翻訳において最も重要視されるのは精度です。DeepLの翻訳結果は概ね品質が良いとの評判を得ており、緊急性の高い情報の基本的な内容をすぐに把握したいという場合には有用でしょう。
ニューラルネットワークの利用と処理速度における技術の進歩には目覚ましいものがあり、機械翻訳の精度は格段に向上してきています。とはいえ、ほかの機械翻訳と同様、人間(翻訳者)による翻訳のみが可能な文脈理解や文化的背景への配慮にまで十分に配慮することはできません。より精度の高い、より自然な表現の文章に仕上げたいと思ったら、ポストエディット(PE)を追加することで修正することが必要です。
費用(コスト)
コストも重要です。機械翻訳のメリットのひとつが、翻訳者に依頼して翻訳作業をしてもらう場合に比べてコストを抑えられるという点です。DeepL Pro の価格は月額で決まっていますが、クリムゾン機械翻訳+ポストエディットの価格は文字数(量)によって加算されるようになっています。また、機械翻訳後にポストエディット(PE)を追加する場合の料金は要見積もりとなっています。
所要時間
DeepLなどの機械翻訳はテキストを入力した直後に訳文を表示してくれるので、短い文章であれば機械翻訳だけでも事は足ります。ポストエディット(PE)を加えても最初から翻訳者が作業を行うよりは短時間で完了させることが可能です。また、機械翻訳を利用する際、以下の準備をしておくことでよりスムーズに進めることができます。
- 翻訳スタイルガイドの作成:スタイルガイドがあれば翻訳者はポストエディットをより速く進めることができます。
- 用語の抽出:翻訳作業を始める前の段階でソースコンテンツから用語を抽出しておけば、翻訳者は用語集と翻訳メモリのデータベースを構築しておくことが可能となり、結果的に作業時間を短縮し、コストの削減にもつながります。
- 原文の確認:ポストエディットの作業を迅速に行なうには、原文が分かりやすくしっかりと書けているかを確認しておくことが最善策です。原文における用語の一貫性や専門用語の適切な使い方、文化的な配慮を事前に確認しておけば編集作業を大幅に削減できます。
情報セキュリティ
サイバーセキュリティの脅威は年々巧妙になっており、オンライン上で作業する機械翻訳もマルウェア、ウイルス、スパイウェア、ランサムウェア、データの盗難などの攻撃にさらされています。 機械翻訳を利用する場合には、入力情報が暗号化され、第三者に読み取られることがないような仕組みになっているかなど、データセキュリティについても確認しておくことが得策です。ISO認証の取得はひとつの目安になります。情報の機密性および保護が保証されているサービスを利用するようにしましょう。
ポストエディット(PE)のメリット
機械翻訳はある言語から別の言語へとテキストを変換することはできますが、慣用句やジョーク、言い回しといった言語人間的な表現を正確に伝えることができないので、ポストエディット(PE)を行うことによりターゲット言語で書かれたように感じられる文化的ニュアンスを翻訳文に取り入れ、より自然な言葉による情報の伝達を実現させます。
また、基本的に機械翻訳はプログラムによって実行されるものなので、認識できないエラーは修正できません。機械翻訳で出力された文章にエラーが含まれていたとしても、そのまま翻訳結果として表示されます。
状況に応じた言葉の選択も機械翻訳にとっては難しいものです。主要な言語は膨大な数の単語を有しているだけでなく、複数の意味を持つ単語も少なくありません。ニュアンスの違いや使用される状況に応じた単語の選択が必要ですが、機械翻訳でこれを判断するには膨大なデータと複雑なプロセスが必要になります。どれほど高度な処理が出来たとしても、文脈や単語の意味を汲みとって翻訳することは難しいので、ポストエディット(PE)によって補正する必要があるのです。
さらに、特定の分野で用いられる語彙あるいは専門用語の使い方についても同じことが言えます。対象分野の知識を有する翻訳者がポストエディット(PE)を行えば、そうした用語の確認もできます。例えば、医療や法律の分野で使われる単語は専門性が高く、機械的な処理で意味を取り損ねた場合、甚大な翻訳ミスが起こる危険性があります。医療翻訳においては小さなミスも許されません。他の学術分野においても高度な専門的な文章の翻訳では、分野に精通する人間が訳文を確認することが非常に重要なのです。
クリムゾンは2つの機械翻訳+ポストエディット(MTPE)プランを提供しています。
• 校正者1名によるMTPE:機械翻訳の結果から重大な間違いを取り除くことに重きを置き、文法的に正確な翻訳であることを確認します。
• 校正者2名によるMTPE:2名の校正者が、文法的な正確さに加え、専門分野での用語の使い方、表現、スタイル、さらに文化的な配慮にも注意して機械翻訳結果を見直し、修正を加えることで、最終的に正確な翻訳になるように仕上げます。
機械翻訳の精度を上げるツール
機械翻訳と言っても、その仕組みはさまざまです。DeepLとクリムゾンの機械翻訳はニューラルネットワークを活用したディープラーニング(機械学習)によってデータベースを構築し、翻訳を行いますが、機械翻訳に翻訳支援ツールや翻訳メモリなどを組み込むことで、翻訳の精度を一層高めることができます。さらに、そうしたツールはMTPEを行う際にも有用です。ツールには以下のようなものがあります。
- 用語管理ツール:全体を通して用語の一貫性を保つための用語管理と検索を可能にするツール。頭字語や略語、同義語の保存から訳語のチェックまで含め、訳文で正しい用語が使用されるようにするのを助ける機能。
- 翻訳メモリ:過去に翻訳した原文と翻訳文を対でデータベース化するもの。同じ文、分節などが文章中に見つかった場合には自動的に訳文に反映させる支援ツール。
- 用語データベース(用語集):特定の分野の用語を検索するためのデータベース。専門用語、固有名詞など特定の用語について対訳語を保存しておく。
機械翻訳の精度は年々、高まっており、対応する言語数も増えています。それでも、機械翻訳だけに頼ることはリスクが高く、人間の翻訳者によるポストエディット(PE)を追加することによって得られるメリットは大きいと言えるでしょう。頻繁に更新されるウェブサイトの翻訳や多言語化への対応として翻訳ニーズが拡大する中、翻訳サービスの選択肢が広がったことはユーザーにとって嬉しいことです。ポイントは、機械翻訳と人間による翻訳の使い分けですが、機械翻訳(MT)+ポストエディット(PE)は有用性の高い選択肢です。おおまかな翻訳は機械翻訳(MT)で行い、細かな部分や専門的な部分に関しては人の手によるポストエディット(PE)を行えば、多くの翻訳ニーズ、利用に十分対応することができるでしょう。
クリムゾンの機械翻訳+ポストエディット(MTPE)はこちらをご覧ください。