IT翻訳者の疑問

この業界に入って約20年。私の疑問は相変わらず解決しません。

「人口知能」を納品前に検出するには

粗探しをしていたわけではありませんが、NVIDIAのWebサイト(https://www.nvidia.com/ja-jp/)を見ていたら目についてしまいました。

誰でもうっかりやってしまいがちな誤変換ですよね。Google検索で「人口知能」という検索条件を指定すると、もちろん「次の検索結果を表示しています: 人工知能」と訂正されますが、「"人口知能" -人工知能」という条件を指定すると結構な数のWebページがヒットします。

今時のかな漢字変換ツールなら「じんこうちのう」で変換すれば「人工知能」という候補が提示されますが、私が使っているATOKでは「人口知能」も予測変換候補の中にありました。危ないですね。

私は、このような誤変換しがちな語句については秀丸エディタのマクロを使ってまとめてチェックすることにしていますが、「誤変換しがち」であることに自分が気づいていなければチェックできません。やはり、執筆/翻訳した人とは別の人の目でチェックすることは大切ですね。

あと、Webサイトのタイポを簡単に修正できるしくみも必要かと思います。これはNVIDIA内部のことなので、外部からどうこう言えることではありませんが、会社が一番にアピールしたいところでの誤字は会社のイメージダウンにつながりかねませんので。

Microsoftの用語集ではsoftware-defined=「ソフトウェアによる」

目新しいIT用語に遭遇したときは、業界標準の日本語訳を調べるためにMicrosoftの用語集も見ることにしています。そこで、NVIDIAのWebサイトにあったsoftware definedを検索してみました。かつての「ランゲージ ポータル」はどこかに行ってしまいましたが、Microsoft Terminology - Globalization | Microsoft Learn というページにあるリンクからMicrosoft Terminology Searchのページにアクセスできます。

Microsoftの用語体系では、software-definedは「ソフトウェアによる」なのですね。

software-definedという用語のConceptは

Pertaining to a technology trend in which technology functions are moved to a virtualized infrastructure.

なのですが、ひとつのtechnology trendを表す言葉として「ソフトウェアによる」はちょっと弱いというか、technology trendと気づいてもらえないのではと思います。

この用語集には、Software-Defined Networkingも登録されています。

ここでも「ソフトウェアによるネットワーク制御」と、「ソフトウェアによる」が使われています。そのConceptは

The use of software to dynamically extend a physical computer network to include pooled and automated virtual resources.

ですので、「ソフトウェアによる」とした気持ちもわからなくはないのですが、definedの意味を反映しなくてよいのでしょうか。この手の新語は逐語訳しておいたほうが無難だと思います。さもないと、別のコンテキストで使われたときに不自然になるような気がします。たとえばsoftware defined storageが「ソフトウェアによるストレージ」、software defined datacenterが「ソフトウェアによるデータセンター」と訳されていたら、これらの用語の持つ意味が日本語できちんと伝わるでしょうか? これがMicrosoft製品だけで使われる用語なら、Microsoftが好きなように決めればよいのですが。

Microsoftの用語集での検索結果をよく見たら、Windows Server software-defined programという用語も登録されているのがわかりました。この日本語訳は「Windows Server のソフトウェアによるプログラム」という、用語集に忠実ではあるもののよくわからない言葉になってしまっています。

ソフトウェアデファインド

NVIDIAのWebサイト(https://www.nvidia.com/ja-jp/)にはいろいろな発見があるのですが、「ソフトウェアデファインド」という表現もその一つです。

英語版のページ(https://www.nvidia.com/en-us/)では、この部分のテキストが対応していないのですが、「ソフトウェアデファインド」はsoftware-definedのことですよね。これってそのままカタカナ表記でよかったんですね。

From developing autonomous vehicles on NVIDIA DRIVE® to creating factory digital twins and retail experiences with NVIDIA Omniverse, our automotive solutions offer the performance and scalability to design, visualize, simulate, and create all types of future transportation.

もちろん、NVIDIAが使っているというだけの理由で「ソフトウェアデファインド」はそのままカタカナ表記で良いと判断するつもりはありません。試しに「ソフトウェアデファインド」をGoogleで検索したら、海外企業のコンテンツをローカライズしたものだけではなく、日本企業が日本語で書いたWebサイトも多数ヒットします。

私がsoftware-definedという表現に初めて遭遇したのは何年も前のことで、SDN(software derined networking)という言葉の一部でしたが、日本語に訳す必要のある場面ではそのまま「ソフトウェアによって定義された」などとしていたと思います。それが今では、ネットワーキングだけでなく自動車にもこの考え方が採用されているのですね。

外国の地名の表記

NVIDIAの日本語版公式サイトのトップページ(https://www.nvidia.com/ja-jp/)を下にスクロールしていくと「NVIDIA について」というセクションがあり、その中にNVIDIA GTCというイベントについてのタイルがあります。

Jensen Huang が、私たちの未来を形作る AI の進歩についてライブでご紹介します。2024 年 3 月 19 日 (日本時間) | カリフォルニア州サンノゼ、SAP Center

この読点で区切られている「カリフォルニア州サンノゼ、SAP Center」は何を意味するのでしょうか。

英語版のページ(https://www.nvidia.com/en-us/)では

Watch Jensen Huang live on stage as he shares AI advances that are shaping our future.

March 18, 2024 | SAP Center in San Jose, CA.

ですので、Jensen Huang氏の基調講演の会場のことですが、カリフォルニア州サンノゼにあるSAP CenterのことをNVIDIAではこのように表記するのでしょうか? これが日本国内のイベントだったとしたら、「千葉県、千葉市幕張メッセ」とは書かないと思います。NVIDIA イベント カレンダーのページでは、「六本木アカデミーヒルズ / 東京」や「ウインクあいち / 名古屋」のように、会場名と都市名がスラッシュで区切られていますね。

あと、「カリフォルニア州」は日本市場から見て外国に当たるのですが、国名は付けないのでしょうか。このあたりは、翻訳作業指示書等にも明記されていないことが多いのですが、日本のマスメディアの記事を見ると、カリフォルニアのような日本人におなじみの地名であってもその前に必ず国名は付けられています。

ファン氏が19日、米カリフォルニア州サンノゼで開いた記者会見で日本に関する質問に答えた。日本語の学習データは特殊だと指摘し、「日本語データでAIを開発し、日本に再び輸入するのを(外国企業などの)第三者に任せる理由はない」と話した。ファン氏は「AIは国家の生産性を高めるベストな方法だ」と指摘した。

NVIDIAファンCEO「日本は自らAI構築を」開発者会議で - 日本経済新聞

NVIDIAのWebサイトでは「生成AI」を検索しても見つからない

Microsoft以外のテクノロジー企業のWebサイトでは、どのような表記が使われているかを見てみました。業績が絶好調で最近の株価上昇の牽引役とも言われているNVIDIAのページです。

www.nvidia.com

  • 全角文字と半角文字の間のスペース:あり
  • カタカナ複合語の単語間のスペース:あり
  • カタカナ語の末尾の音引き:アーキテクチャアクセラレータ、イノベーター、キャラクター、コンピューター、ゲーマー、サイバーセキュリティ、テクノロジ、データセンター、パラメーター

全体的にはMSと同じような傾向ですね。

なぜNVIDIAが好調かというと、AIに必要な処理能力を同社のGPUが実現できるからだそうです。そこで、生成AIについてNVIDIAがどのようなコンテンツをWebサイトで用意しているかを調べようとしたのですが、「生成AI」で検索しても見つかりません。検索フィールドに「生成 AI」と入力すれば見つかります。いろいろなコンテンツを詰め込んだ会社のトップページを全部見ている暇はないので、ブラウザーの検索機能を活用したいのですが、これでは面倒すぎます(もしかして他のブラウザーではあいまい検索ができるのかもしれませんが)。全角文字と半角文字の間にあるスペースは有害であると言ったら言い過ぎでしょうか。

全角文字と半角文字の間のスペースは本当に必要ですか?

過去に何度もネタにしましたが、この規則のおかげで日本語ローカライズ業界全体でどれだけの生産性が失われているのかと、改めて考えずにいられません。

最近の機械翻訳の出力はよくできていて、案件によっては訳文の手直しがほんとうに少ないことがあります。でも、「全角文字と半角文字の間のスペース」が統一されていない。空いていたりいなかったりするので、目視でチェックして修正するのですが、この手間をかけずに済ませることはできないのでしょうか?

生成AIの時代が到来し、クリエイティブな作業もAIがこなせるようになったのに、人間の翻訳者が未だに「全角文字と半角文字の間のスペースの統一」という機械的な作業をさせられるのはいかがなものかと思います。Microsoftあたりが「もうやめる」と言ってくれないものでしょうか。そういう規則を決めた人の面子とか、こちらの知ったことではないので。だってほんとうに視認性のために必要だったら、Copilotの出力もそうなっていますよね? でも現実は、たとえばEdgeのCopilotに「来年の春分の日は何日?」と尋ねると

来年の春分の日は**2025年3月20日(木曜日)**です¹²³。春分の日は、太陽が南から北へ通り、昼と夜の長さがほぼ同じになる、天文学的な春の最初の日です。この日は、地球の軸の傾きによって決まります。¹

北半球では、春分の日を使って春の季節が正式に始まり、終わる時期を決定する国々が多くあります。一方、南半球のオーストラリアやニュージーランドでは、気象学的な春を使用しています。気象学的な春は、年間の気温サイクルとグレゴリオ暦に基づいており、3か月間(3月、4月、5月)続きます。¹

のような答えが返ってきます。全角文字と半角文字の間にスペースがなくてもまったく困ることはありません。

Tradosからのメール

「お急ぎください! | Trados Studio 2022 Freelanceが最大25%OFF」(2023/11/15)

※キャンペーン終了は2023/11/22

 

「最後のチャンス | Trados Studio 2022 Freelanceが最大25%OFF」(2023/11/22)

※キャンペーン終了は2023/11/22

 

「Trados Studio 2022 Freelanceが最大45%OFF」(2023/11/24)

※キャンペーン終了は2023/11/30

 

「Trados Studio 2022 Freelanceが30%OFF」(2023/12/15)

※キャンペーン終了は2023/12/31

 

仕事で使うツールなので、必要なときに安心して購入できる価格であってほしいものです。私は既にライセンスを持っているので、購入するとしたらアップグレード版ですが。