Googleと翻訳支援ツールの連携①:セキュリティと料金の疑問はこれでスッキリ

機械翻訳と翻訳支援ツール

翻訳支援ツール上で翻訳メモリと機械翻訳を連携させることで、最新のテクノロジーを使って効率よく翻訳をすすめることができます。

この際、有料のGoogle機械翻訳エンジンがよく選ばれています。というのも、無料で公開されているGoogle機械翻訳は、機密性の高い翻訳業務では使えません。

有料版のGoogleの機械翻訳エンジンは、APIを使って、SDL Trados や Memsource(メムソース)などの翻訳支援ツールとの連携も可能です。

とはいうものの、いざ翻訳業務に使うとなると、セキュリティ対策や料金についてわかりにくいところもあります。

クライアントや社内からセキュリティに関する不安があがっても自信をもって答えられるように、Google機械翻訳のセキュリティについてご説明していきますね。

また、料金についても、確かにGoogle機械翻訳は安いのですが、気を付けないと思わぬお金がかかってしまうポイントがあります。料金計算で気を付けたい3つのポイントについて、書いていきます。

連携の方法については、次回の記事で詳しくご紹介していきます。

Google機械翻訳のセキュリティ・機密性について

Google機械翻訳を実際の翻訳業務に使うときは、セキュリティが気になる、という話はよく伺います。万が一情報漏洩のニュースなどでたら、会社であればクライアントの信頼を失って、業務を続けることができない事態にもつながってしまいますよね。

そんなことにならないように、Googleの機械翻訳のセキュリティについて、よくある疑問をもとに、解説していきます。

 

疑問1「データがGoogle機械翻訳エンジンの向上のために使われない?」

Googleはこの点について、「現在使用することはありません」と明記しています。

 

「現在、Google Translation の機能のトレーニングと機能向上のために、送信されたコンテンツを Google が使用することはありません。」

引用元:Google Cloud / AIと機械翻訳プロダクト / データ使用に関するよくある質問

 

気になる点は「現在」(Currently) としているところです。Googleはその気になれば、いつでも方針を変えることができます。方針変更前には通知があるとは思いますし、これほどの重要ポイントについて簡単に方針は変えないと予想されますが、注意はしておいたほうがよさそうですね。

また「送った原稿については分かったけれど、翻訳した結果についても使われることはないか」という質問もいただいたので、Googleに確認してみました。

普通に英語のサポートサイトからGoogleに問い合わせをしたところ、まず、サポートの方が一時対応をしてくれました。

「詳しくは専門の部署に確認しているから、もう少しまってくださいね。」

と、フレンドリーで丁寧なお返事いただきました。

 

そして待つこと数日、本当に、専門の部署の人から、より詳しいお返事をもらいました。お返事の内容は、次のとおりです。

 

 

翻訳した結果は、通常、数時間だけサーバーに保管されます。不具合修正などの目的で、もう少し長く保管される場合もあります。ですがGoogleが翻訳したデータのコンテンツの所有権を主張することはありません。

 

メタデータも、サービス改善は不具合修正のため一時的にサーバーに保管されることがあります。ですが、使用するのはAPIのコール数などのデータであり、保管期限は30日だけです。

 

 

実は「忘れられているんじゃないか」って思っていたので、びっくししました^^;)

Googleさん、ありがとうございます!

ちなみに、原稿テキストと翻訳結果といったデータの送受信はSSL暗号化通信で行われるので、第三者によるデータの盗聴やなりすまし、改ざんなどから守られています。

では、セキュリティに関する次の質問にいきますね。

 

 

疑問2「原稿データは国外サーバに置かれるの?」

データが国内からでないかどうかは、通常のクラウドサービスの利用の際にもよく聞かれるポイントです。ただGoogleを使う場合には、データは国外にでるもの、とあきらめるしかありませんよね。最近はGoogleの機械翻訳エンジンの精度の高さ、クラウドへの理解も深まっているので、一部の分野をのぞいては、この点について、あまりうるさくいうお客さんはいないように感じます。

 

「Google のサービスはグローバルであり、データが特定の地域を離れて処理されることがないと保証することはありません。」

引用元:Google Cloud / AIと機械翻訳プロダクト / データ使用に関するよくある質問

 

疑問3「データの所有権はGoogleのものになっちゃわない?」

データの所有権については、Googleが主張することはない、と明記されています。

「Cloud Translation API に送信したコンテンツ(テキストやラベルを含む)のいずれの所有権についても Google が主張することはありません。」

引用元:Google Cloud / AIと機械翻訳プロダクト / データ使用に関するよくある質問

 

なお、Googleのサーバーのセキュリティ対策は、こちらのページにまとまっています。

Google security whitepaper  |  Documentation  |  Google Cloud

 

「Googleさんなら、ウイルス対策とかは万全でしょう」という信頼感からか、会社やサーバーのセキュリティ対策自体に不安を覚える人はあまりいません。ですが、最初の質問「Googleがデータを使ってしまわないか」は、Googleの機械翻訳エンジンを使ってみたいという会社が一気に増えたとき、よく聞かれました。

私はGoogle機械翻訳導入サービスをやっていたわけではないのですが^^; きっと皆さん、クライアントに聞かれたときのことを考えて、困ったのでしょうね。

しっかりとGoogleのセキュリティを説明できれば、クライアントに納得いただけるケースが多いと思います。ただ、それでもクライアントが懸念を示す場合には、無理にGoogleの機械翻訳を使うのは避けたほうがよいのでは、と思います。

Google機械翻訳エンジンの料金

Google機械翻訳エンジンの料金は、こちらの料金表に記載されています。

 

Google機械翻訳の料金

参照元:Google Cloud/ Cloud Translation API / ドキュメント / 料金

 

翻訳の場合は、上記の表から計算すると、1文字あたり、0.00002ドルになります。

20ドル÷1,000,000 = 0.00002

 

この金額が、翻訳に使った文字数に応じて請求されます。たとえば、1 か月間に 75,000 文字を処理した場合、1.50ドルとなります。

0.00002×75,000文字=1.50ドル

 

とてもリーズナブル、ですね^^

ただここで、料金を計算するうえで注意したい点があります。Googleは「 料金はスペース文字を含めて、API に処理のために送信された文字ごとに請求されます。」と書いています。

「* 料金はスペース文字を含めて、API に処理のために送信された文字ごとに請求されます。空白のクエリは 1 文字として請求されます。Google では、文字がマルチバイトでも 1 文字ごとに課金しています。この場合、文字がコードポイントに対応します。たとえば、「こんにちは」を英語に翻訳する場合、5 文字が請求対象として数えられます。」

参照元:Google Cloud/ Cloud Translation API / ドキュメント / 料金

 

この文章には、じつは Googleの機械翻訳の料金を計算するうえで大事な3つのポイントが隠されています。

 

ポイント①「送信された」文字なので、実際にその文字を翻訳に使用しなくても、料金は発生する

翻訳支援ツール上で機械翻訳を使うときは、一括で流し込むこともできますし、下記のように、翻訳しながら表示させることもできます。この際、翻訳支援ツールのエディタ上には、機械翻訳の翻訳結果を、翻訳メモリと共に表示させることもできます。

SDL Trados上で機械翻訳と翻訳メモリの結果を併記

 

機械翻訳の訳は参考にせずに、翻訳メモリだけを利用する場合でも、このようにエディタ上に表示させた段階でGoogleへの支払いは発生します。

 

ポイント②スペースも1文字としてカウントされる。

英語→日本語を翻訳するときには、要注意ですね。英語はワードがスペースで区切られますが、このスペースも1文字としてカウントされます。

 

ポイント③マルチバイトもシングルバイトも同じ計算

ざっくりいいますと、シングルバイトは半角文字のこと。マルチバイトは全角文字です。ということは、英語はシングルバイトで、日本語はマルチバイトです。英語→日本語の場合にも、日本語→英語の場合にも、「文字数」でカウントする、ということになります。

たとえば次のような英文をGoogle機械翻訳にかけた場合の料金を計算してみます。

I have an apple.

スペースも含めると、16文字です。そこでGoogleの翻訳料金は次のとおりになります。

0.00002 × 16 = 0.00032

 

では次に、次の日本語をGoogle機械翻訳にかけた場合の料金を計算してみます。

リンゴをもってます。

この文章は10文字です。Googleの翻訳料金は次のとおりになります。

0.00002×10=0.0002

 

1文字の単価が安すぎてわかりにくいですが^^;

翻訳の仕方にもよりますが、英語のほうが高くでそうですよね。Google機械翻訳の料金設定は、英語の場合にはスペースが入ることもあり、日本語→英語のほうが、英語→日本語よりも安く算出される傾向があるようです。

 

上記3点がGoogle機械翻訳の料金を計算するうえでの注意ポイントです。Googleの翻訳料金を計算するときの盲点ともいえます。使い方によっては思ったよりも高くなる可能性があるので、気を付けてみてくださいね。

Google機械翻訳エンジンを無料で試す

最初は無料でGoogle機械翻訳エンジンを利用することができます。

無料トライアルは常にやっているようですが、時期によって条件が変わります。2019年3月7日現在は、「12ヵ月の有効期限付きで300ドル分」無料で使えます。

 

google 機械翻訳エンジンの無料トライアル

引用元:Google Cloud Platform 無料トライアル登録ページ

 

300ドルでは何文字翻訳できることになるか、計算してみます。

300ドルをGoogleの機械翻訳1文字あたりの単価、0.00002円でわってみます。

300÷0.00002=15,000,000

なんと、1500万文字分、無料で使えます!

しかも、もし文字数を超えてしまった後も、自動でクレジットカードに課金することはありません。登録時に表示されるメッセージで、Googleは次のように明記しています。

Googleによるクレジットカード自動引き落としなしのメッセージ

引用元:Google Cloud Platform 無料トライアル登録ページ

ということで、最初はお金のことを気にせず、Google機械翻訳エンジンの性能をどんどん試していきましょう^^

 

*上記の条件は時期によって変わる可能性があるので、実際に申し込む際には、登録時にでてくるメッセージをよく確認してくださいね。

まとめ:Googleのセキュリティと料金について

Googleの機械翻訳の料金は、やっぱり非常にリーズナブルです。ですが料金は注意すべき3つのポイントがあります。このポイントをおさえておかないと、「思ったより高い」ということにもなりかねません。

 

ポイント

①「送信された」文字なので、実際にその文字を翻訳に使用しなくても、料金は発生する

②スペースも1文字としてカウントされる。

③マルチバイトもシングルバイトも同じ計算

 

とはいっても、無料お試しでかなりの文字数を処理できるので、「Google機械翻訳の性能をしりたい」「翻訳支援ツールと連携させて効果を測定したい」という場合は、気軽にテストできますね。

 

セキュリティについては、よく聞かれるポイントをまとめました。

Google側では「データを自分たちのために使うことはしない」と明記しています。この方針を突然変えることは考えにくいのですが、ただ、可能性はゼロではありません。

Googleのセキュリティに強い懸念をもたれるようであれば、他の有料エンジンを検討していくこともおすすめします。案件の内容やクライアントによって、機械翻訳エンジンも上手に使い分けていきましょう。