翻訳業界の黒船 ニューラル機械翻訳

グローバル化が進み、多言語への翻訳、しかもタイムリーでコストパフォーマンスのよい翻訳のニーズが高まる中、どうしたら品質を保ちつつ短時間でコストを抑えた翻訳ができるのか、といった点が課題となってきました。これを解決すべく登場したのが、IT技術を活用した機械翻訳です。翻訳者による翻訳はもちろん高品質ですが、どうしてもそれなりの時間と費用を要してしまいます。一方で機械翻訳だけに頼れば、作業スピードは上がりコストを抑えることができますが、品質面では懸念が残ります。
そこで、今注目されているのがニューラル機械翻訳です。ニューラル機械翻訳を用いると文書を素早く翻訳することができるだけでなく、その訳文も内容によっては翻訳者が翻訳したかのような出来栄えと言われています。グローバル社会にインパクトを与えつつある、このニューラル機械翻訳(NMT)とはどのようなものかご紹介します。

機械翻訳の歴史とニューラル翻訳

まず、機械翻訳の歴史を振り返っておきたいと思います。機械翻訳の概念が初めて提唱されたのは17世紀にまでさかのぼると言われています。ただし、本格的な研究は1950年代に入ってから米国政府によって始められました。1970年代になると、翻訳元、翻訳先の言語の文法規則にもとづくルールベース翻訳が登場し、さらに統計的機械翻訳が生み出されました。統計的機械翻訳は、あらかじめ用意された学習用のテキストデータから統計モデルを構築し、翻訳を行うものです。そして、2014年にまったく新しい手法として登場したのが、ニューラル機械翻訳です。

ニューラル機械翻訳とは、人間の脳神経回路が情報伝達を行う仕組みをまねたもので、人工的なニューラルネットワークが情報を収集して自ら学習しながら、単語の意味として正しい可能性の高い訳語を当てはめていくものです。ひとつひとつの単語を訳していくのではなく、原文全体をひとつの固まりとして捉えて訳していくため、より自然な訳文を生成することができます。

ニューラル機械翻訳は翻訳のプロセスにおいて、エンコードとデコードと呼ばれる2種類の分析を行っています。エンコードの段階では、原文を取り込み、実数値であるベクトルに変換していきます。その際、文脈上の意味が似ていると判断した単語を、同じベクトルに分類します。次にデコードの段階では、変換されたベクトルに応じた翻訳先の言語に変換していきます。つまり、ニューラル機械翻訳は単語やフレーズを単純に翻訳先の単語に置き換えていくのではなく、文脈や文意を翻訳しているのです。

ニューラル機械翻訳の特長

ニューラル機械翻訳の特長には以下のようなものがあります。

  • 統計的機械翻訳から生成された言語規則を人工的なニューラルネットワークが自律的に学習するアルゴリズムを採用している
  • フレーズにとどまらず、文章全体を考慮する
  • 言語の持つニュアンス、語尾変化や敬語、男性/女性名詞を学習する

これらの特長を有することにより、統計的機械翻訳と比較して、語順、構文エラーといった問題が発生しにくく、また、韓国語や日本語、アラビア語といった文法が難解だとされる言語にも適切に対応できるとされています。

ニューラル機械翻訳の活用

ニューラル機械翻訳の利用は、今後ますます多くの業界に広がることが予測されます。それにより、例えば、eラーニングプログラムでの学習をスムーズにすることや、国際会議でのプレゼンテーションやテレビ会議でのコミュニケーションにおいて言語の障壁を取り除くことが可能になります。また、旅行業界やECサイトであれば、世界中の顧客からの問い合わせに効率よく対応することができるようになるでしょう。翻訳業界でも、高品質の翻訳を迅速に提供する手法のひとつとして検討することができます。

非常に有用なニューラル機械翻訳ですが、その翻訳プロセスの構造上、訳抜けが起きることがあり、訳文が自然であることから、統計的機械翻訳に比べて訳抜けに気づくことが難しいという難点もあるようです。とはいえ、グローバルでのコミュニケーションにおける機械翻訳のニーズは高まるばかりです。ニューラル機械翻訳の今後のさらなる精度向上が期待されます。

Leave A Reply

Your email address will not be published.

お気軽にお問い合わせください

toiawase@crimsonjapan.co.jp