2016年頃から、機械翻訳システムにニューラル・トランスレーション・ネットワーク(NMT)という新しい仕組みが採用されて品質が向上し、翻訳という仕事がいずれなくなるのではないかという声も聞かれるようになってきました。

NMT は、これまでの機械翻訳が実現できなかった流暢性(Fluency)を高水準で実現しており、誰が見ても読みやすくなっていることは間違いありませんが、本稿では、2019年時点におけるNMTの実力についてもう少し詳しく見てみましょう。

特許明細書から抜粋した英文を、無料で使用できる4つの機械翻訳サービスA、B、C、Dにかけてみました。

【原文1】
FIG. 1A is a schematic block diagram illustrating a computer system including a hybrid hard disk drive (HDD) according to an embodiment of the present invention.

【A-1】
イチジク。 図1Aは、本発明の一実施形態によるハイブリッドハードディスクドライブ(HDD)を含むコンピュータシステムを示す概略ブロック図である。

⇒ 「FIG」 を「Figure」と認識できていません。

【B-1】
図1Aは、本発明の一実施形態によるハイブリッドハードディスクドライブを含むコンピュータシステムを示す概略ブロック図である。

⇒ ほとんど問題ありませんが、「(HDD)」が抜け落ちています。

【C-1】
図1Aは、本発明の一実施形態によるハイブリッド型ハードディスクドライブ(HDD)を含むコンピュータシステムを示す概略ブロック図である。

⇒ ほぼ良さそうです。

【原文1】は、特許明細書における定型文です。このような定型文や比較的短い文であれば、NMT はかなり正確に訳せますが、原文にない情報を入れてしまう「湧き出し」や、原文に明記されている「訳抜け」など、ルールベースのMTには見られなかった新たな問題を露呈しています。

次に、長めの文をNMTにかけてみました。77ワードという比較的長い文ですが、目的語が多いだけで、文構造は至ってシンプルです。

【原文2】
The second plurality of straps 103 further comprises a fifth webbing 131, a sixth webbing 132, a seventh webbing 133, an eighth webbing 134, a ninth webbing 135, a third male buckle connector 136, a fourth male buckle connector 137, a fifth male buckle connector 138, a sixth male buckle connector 139, a seventh female buckle connector 140, a fourth ring and slider 142, a fifth ring and slider 143, and a sixth ring and slider 144.

【A-2】
第2の複数のストラップ103は、第5ウェビング131、第6ウェビング132、第7ウェビング133、第8ウェビング134、第9ウェビング135、第3オスバックルコネクタ136、第4オスバックルコネクタ137、第5オスをさらに含む。 バックルコネクタ138、第6のバックルコネクタ139、第7の雌バックルコネクタ140、第4のリングおよびスライダー142、第5のリングおよびスライダー143、および第6のリングおよびスライダー144。

⇒ 「オス」と「雄」という具合に表記が揺れるとともに、include に対する「含む」という訳語が誤配置されてしまっています。

【C-2】
第二の複数のストラップ103は、第五のウェビング131 132、第六のウェビング133、第七のウェビング134、第八のウェビング135、第九のウェビング136、第三の雄バックルコネクタ137、第四の雄バックルコネクタ138、第五の雄バックルコネクタ139、第六の雄バックルコネクタ140、第七の雌バックルコネクタ142、第四のリング及びスライダ143、並びに第六のリング及びスライダ144をさらに含む。

⇒ 部材番号132の構成要素が訳されておらず、ここを起点にして部材番号と序数がずれてしまっています。また、a fifth ring and slider が訳されていません。

【D-2】
第2の複数のストラップ103は、第5のウェビング131と、第6のウェビング132と、第7のウェビング133と、第8のウェビング134と、第9のウェビング135と、第3の雄バックルコネクタ136と、第4の雄バックルコネクタ137と、第5の雄バックルコネクタ138と、第6の雄バックルコネクタ139と、第の雄バックルコネクタ140と、第の雄バックルコネクタと、第7の雄バックルコネクタと、第の雄バックルコネクタ5と、を備える。142 143 144 6四

⇒ 途中から序数が抜け、部材番号が迷子になってしまっています。

上記のとおり、長い文に対する解釈はかなり不安定です。このレベルの訳文ですと、ポストエディットの負担も大きいため、下訳として使うことにも躊躇する人が多いと思います。

以上の結果から、少なくとも2019年の時点では、機械翻訳が翻訳者の驚異とはなり得ないことがわかります。NMTの登場により、ルールベース機械翻訳(RBMT)は姿を消しつつありますが、原文2に対する翻訳結果を見る限り、特許翻訳に関しては、RBMTを活用できる余地がまだありそうです。