失敗しないポストエディットで翻訳を効率化する3つのポイント

ポストエディットと機械翻訳

ポストエディットをどうするかで、翻訳の結果は大きく変わってきます。

でも、ポストエディットという言葉自体、最近広がってきたばかり。

「そもそも何をやったらいいのか、よくわからない」という部分もありますよね。

間違ったポストエディットは、機械翻訳の効果をさげる結果になってしまいます。

まず、「ポストエディットとは何か」を理解し、そしてポストエディットで翻訳を効率化するための3つのポイントをおさえていきましょう。

機械翻訳エンジン導入の成果をフルに生かし、コストと時間の削減を実現できます。

ポストエディットとは

ポストエディットとは、機械翻訳が行った翻訳の後処理です。

機械が翻訳をしただけでは、誤訳が含まれていたり、意味が通らなかったりすることがあるので、人が修正をする必要があります。具体的には、間違った翻訳を修正したり、ふさわしくない用語をなおしたり、表記を整えたり、語順を入れ替えてわかりやすくしたりします。

 

従来の翻訳は、最初から最後まで、人間だけで行うものでした。

そこに翻訳支援ツール(CATツール)というものが導入され、人間が行う翻訳を効率化することが可能になりました。過去の翻訳をデータベース化し、再利用することができるようになったのです。

CATツールとの連携翻訳イメージ

ただこの場合でも、翻訳自体は、人が行うものでした。

 

数年前から、機械翻訳のエンジンの性能が一気に向上したことで、人ではなく、機械が翻訳を行う方法が広まっています。同時に、機械が行った翻訳を人が編集する「ポストエディット」という方法が広がっています。

機械翻訳との連携イメージ

 

この「ポストエディット」を行う際に大事なポイントが3つあります。

ポイントを押さえておかないと、せっかく導入した機械翻訳エンジンの効果を生かせない、という結果にもなってしまいます。

ここから3つのポイントを書いていきます。

ポイント① ポストエディットの品質レベルを明確にする

ポストエディットには、ライトエディットとフルエディットの2つのレベルがあります。ポストエディットを行う前に、必ず、このレベルを確認するようにしましょう。

会社によっては2つではなく、3つに分けているところもあります。また、呼び名もライトエディットではなく、ラピッドエディットと言ったりもします。

なぜこのレベルの確認が必要かというと、ポストエディットにかける時間、そして最終的な翻訳品質に大きく関わってくるからです。

ライトエディットとは、「意味が伝わればいい」程度の翻訳レベルです。表記やスタイルの統一は求められません。フルエディットは、「人間が翻訳したときと同じ品質」が求められるレベルです。表記やスタイルの統一も求められます。

 

たとえば、次の文章をライトエディットとフルエディットでそれぞれ修正してみますね。

原文
1. Add bran and mustard powder in a bowl and mix. Use new bran.
2. Add the (A) to the pot, bring to the boil. Let stand until cool. Add them to (1) little by little, and mix well.
機械翻訳結果
1. 鉢とミックスにふすまとからしの粉を足してください。新しいふすまを使ってください。
2. ポットに(A)を足してください、沸騰させてください。涼しくなるまで放置してください。彼らを(1)に少しずつ足してください、そしてよく混ぜてください。

 

ライトエディット
1. ボウルにぬかとからしの粉を足して混ぜてください。新しいぬかを使ってください。
2. 鍋に(A)を加えてください。沸騰させてください。冷めるまで放置してください。それらを(1)に少しずつ加えてください。そしてよく混ぜてください。

 

フルエディット
1. ボウルにぬかと粉からしを加えて混ぜます。ぬかは新しいものを使うようにしてください。
2. 鍋に(A)を加えて沸騰させた後、冷まします。 冷めたら(1)に少しずつ加えてよく混ぜます。

 

品質に大きく違いがありますよね。

ライトエディットでは、最低限、間違った用語・翻訳を変更しました。

フルエディットの例では、用語に加えて、より自然な日本語になるように言い回しも変え、読みやすくしました。

このように、ライトエディットとフルエディットでは、出来上がった訳文が大きく変わります。

 

「フルエディット」を求めている人に「ライトエディット」の翻訳を納品するのは、フランス料理のフルコースを頼んだお客さんに、ファミリーレストランのハンバーグ定食をだすようなものです。当然トラブルにつながりますよね。

 


*けっしてファミリーレストランのハンバーグが悪いと言っているのではありません!期待している料理がでてくるかどうかの参考として例にさせて頂きました。

 

翻訳を社内で行うにしても、外注するにしても、依頼する側と作業を行う側で、求められる品質を共有しておくことが大事です。「フルエディット」か「ライトエディット」か、さらに、実際に行う作業内容についても、事前に取り決めておくことをおすすめします。

この「作業内容」を明確にしたものを「ポストエディットのガイドライン」と呼んだりします。こういったものを作って文書化・リスト化しておくと、品質の共有がしやすくなります。

ポイント② 機械翻訳×ポストエディットの作業効率を数値化する

「機械翻訳を行うとどんな文書でも効率がいいのか?」というと、そういうことはありません。文書によっては機械翻訳に向かないものもあります。

文芸翻訳やマーケティング翻訳では、翻訳をこえた意訳が求められることもあります。

たとえば、スティーブ・ジョブズのあの名言を機械翻訳にかけてみます。ガンを宣告されたジョブズが、スタンフォード大学で行った有名な講演の中の言葉です。

英語原文

You can’t connect the dots looking forward; you can only connect them looking backwards. So you have to trust that the dots will somehow connect in your future.

機械翻訳結果

楽しみにしている点を結ぶことはできません。あなたはそれらを後ろ向きに見て接続することしかできない。だからあなたはドットがどういうわけかあなたの将来的につながることを信頼しなければなりません。

 

Google翻訳にかけてみましたが、やっぱり、悲しい翻訳結果ですね^^;

きちんと翻訳すると、こういった文章になります。

「未来を見て、点を結ぶことはできない。過去を振り返って点を結ぶだけだ。だから、いつかどうにかして点は結ばれると 信じなければならない。」

 

ですがこの例とは反対に、機械翻訳が得意な文書もあります。

たとえばメールや社内文書。「品質や正確さはともかく、今すぐどんなことが書いてあるかを知りたい」という文書では、機械翻訳を活かせます。概要さえわかればよいのなら、ポストエディットも不要な場合があります。

 

ただ、この2つの用途は極端な例です。

実際には、人間がやったほうがいいか、機械がやったほうがいいか、どちらか分かりにくいグレーゾーンが多くあります。さらに、今までは人がやることが当然だった分野でも、機械翻訳の性能向上によって、機械がやったほうがよいと判断される範囲が広がりつつあります。たとえばヘルプ関連ですとか、医療機器のマニュアルなどです。

 

もしも機械翻訳に向いていない文書にも機械翻訳を使うと、ポストエディター(ポストエディットをする人)の負担が増えるでしょう。結果的にかかった多くの時間と労力を考えると、「最初から人が翻訳したほうがよかった」という残念な事態にもなりかねません。

こういったことを避けるためにに、まず①に書いた品質レベルをきめておくこと、そして次に、機械翻訳の効果を数値化するために、テストプロジェクトを実行することをおすすめします。

 

その際、次のような指標を使って、翻訳の効率化を数値測定することができます。

翻訳の効率化の測定

  1. 外注する場合は、人の翻訳と、機械翻訳+ポストエディット、それぞれの外注コストを比較する
  2. 社内で行う場合は、それぞれの工程の社内でかかる時間を比較する

 

他にも、ポストエディットによって編集されたワード数・文字数をカウントする、という方法もあります。翻訳支援ツールによっては、こういったカウントを簡単にできる機能がついているものもあります。

このような測定を行うことは、ポストエディターに正当な対価を支払うためにも大事です。

機械翻訳が向く文書かどうか、実際のコストや時間をはかっていくことで、「なんとなく」に左右されない正しい判断をすることができます。

ポイント③ 追加工程を検討する:プリエディット(前編集)

機械翻訳をかける前に原文テキストを変更することをプリエディット(前編集)、あるいは前翻訳と呼んだりします。

 

人が行う翻訳は、通常、翻訳+校正の2段階で構成されます。

一方機械が行う場合には、機械翻訳+人によるポストエディットの2段階となります。

 

緑色のボックスが人が行う作業です。

機械翻訳を使うと人がかかわるステップが1つだけになるため、コストの削減が図れるといわれています。ただ、機械翻訳を行う場合でも、プリエディット(前編集)の工程を1つ増やすことで全体効率がよくなるなら、検討する価値があります。

 

そもそも機械翻訳は日本語⇔英語よりも、ヨーロッパ言語間で用いる方が良い結果が期待できます。というのも、それぞれのヨーロッパ言語は文法が似ているからです。

日本語は主語が抜けていたり、いいまわしが曖昧であったりする場合があるので、良い機械翻訳結果が得られない場合があります。

こういった場合、究極的には原文テキストの書き起こしの段階から表現を見直すことで、翻訳の精度をあげることができます。それがむずかしい場合には、それがむずかしい場合には、完成した原文テキストを後から編集するというのも選択肢のひとつです。

 

原文を書き換えるというのは、普通に考えると工程が1つ増えるので効率が悪いはずですよね。

ですが、たとえば多言語プロジェクトの場合はどうでしょう。1つの原文が複数の言語に訳されるので、原文テキストを書き直すことで得られる効果は大きいです。

 

また、もし不適切な用語が使用されているために機械翻訳の精度が下がる場合、かつ、その用語が頻出しているとしたら、マクロを作って原文の修正を一括で行うこともできます。このように、修正の自動化が可能であれば、人が行う作業は増えないので、作業効率にはあまり影響しません。

 

思ったような機械翻訳結果が得られない場合には、ポストエディットの工程以外で出来ることはないか、検討してみるのもひとつの手です。大きなプロジェクトであれば、工程の見直しによって得られる効果も大きいです。

まとめ:正しいポストエディットを行う3つのポイント

機械翻訳で効率化がはかれるかどうかは、ポストエディットだけではなく、求められる品質や原文のテキストによって異なってきます。

具体的には3つのポイントがあります。

 

ポイント

■1つ目は、ポストエディットのレベルを事前に明確にしておくこと。ポストエディットを依頼する側と実施する側が、品質レベルと作業内容を共有できていないと、あとからトラブルになります。

■2つ目は、機械翻訳に向く文書かどうかを数値化して判断すること。現在の機械翻訳では、まだ翻訳作業を効率化ができない文書もあります。ただ、機械翻訳が使える範囲はどんどん広がっています。実際にポストエディットにかかる時間・コストから、効果を測定していくとで、正しい判断ができます。

■3つ目は、工程を増やすことで機械翻訳の精度を上げることができないか、検討すること。プリエディット(前翻訳)を行うことで全体の効率化をはかることもできます。

 

3つ目の補足として、ポストエディットの後に、マクロによる自動校正の工程の追加も検討できます。スペースや全角・半角の修正など、人が行うと時間がかかる上に修正漏れがあるかもしれない部分を、自動化して行うことで効率化が期待できます。

機械翻訳を取り入れることで、従来までの作業フローがかなり変わることになります。これまでの方法を変えるときは、ストレスが生じますし、現場に反対意見もでやすくなります。

人によるポストエディットの部分だけ強化して、力技で乗り切ろうとすれば、やがて限界を迎えるでしょう。

もし「機械翻訳を導入したいけれど不安」という場合には、ぜひ、上記のポイントをおさえて、効率よく機械翻訳を味方につけていってくださいね。