IT翻訳者の疑問

この業界に入って約20年。私の疑問は相変わらず解決しません。

Google検索の結果から機械翻訳を除外するには

日本語の表現として妥当かどうかを判断するときにGoogleの検索結果件数はあてにならないと思う、というのは前に書いた通りですが、プロではなく素人が書いたものがヒットしやすい、同じコンテンツが何度もカウントされるといった理由に加えて、最近では機械翻訳されたコンテンツがやたらヒットするという問題があります。
たとえば、Googleで"収益ストリーム"を検索すると、最初の10件のうち3件はどうみても機械翻訳されたものです。「自動翻訳されたものです」と明示されていれば「-自動翻訳」で除外できますが、全部がそうとは限りません。他の言語に翻訳されたページも表示できるようになっている場合に「このページを翻訳する」といった語句が書かれていることもありますが、単にいろいろな国の国旗のアイコンだけが並んでいることもあります。翻訳エンジンを使って自動的に生成されたページには、その翻訳エンジンの名前が表示されるようになっているとよいのですが。
自動翻訳を使う人は、自分の母国語以外の読者にも自分の意見を知って欲しいと思って使っているのでしょうが、現状ではまだまだな感じがします。なぜか命令形が「〜ください」ではなくて「〜しなさい」なんですよね。「私たちに連絡しなさい」って何様のつもりでしょうか。http://www.joelblock.com/blog/wp-content/plugins/translator.php?l=ja&u=http://www.joelblock.com/blog/7/diversify-your-revenue-streams/などは、いい線いっているとは思うのですが「売上高はタコ。」ですからね。キャピタライズされているキーワードを認識するのはまだ無理なのでしょうか。ただ、このページ(たぶんGoogleの自動翻訳機能を使っている)のように、テキストにマウスカーソルを合わせるとオリジナルの英文が表示される仕組みは良いですね。英語から日本語に訳された技術リファレンスなどは、人間が訳したものであっても全部こうすればいいのにと思うぐらいです。