特許明細書の日英翻訳におけるプリエディット効果

皆さんこんにちは。リンゴプロ翻訳サービスの中村です。

遡ること5年。2019年の秋だったと思います。私はSDL社より製品紹介イベントへの登壇依頼をいただき、5年後の翻訳市場を考えるというテーマで私見を述べました。

Googleより、ディープラーニング技術を用いたニューラル機械翻訳(Neural Machine Translation、NMT)というテクノロジーを搭載した翻訳サービスが登場し、翻訳業界でも驚きを以て受け止められたのが2017年ごろだったでしょうか。2019年の時点では、NMTがそれなりに業界に浸透しており、今後はどうなっていくのかということで、あのようなテーマが立てられたのでしょう。

私はその席で、日英翻訳の機械出力の結果を改善するために、原文のプリエディットが進むのではないかという予想を述べました。英訳結果を想定しながら和文を事前に編集することにより、日英翻訳にも機械翻訳が浸透していくと予想していたのです。

実際に5年近くが経過した現在の状況を鑑みると、私の予想は外れたようです。原文をプリエディットして機械翻訳を適用するというワークフローはあまり浸透していませんが、その見立てが間違いだったとも思えません。

そこで本稿では、私が5年前に提唱した原文プリエディットが機械翻訳の出力結果に及ぼす影響の大きさと効果の有無を、Google Patentsから無作為に抽出した特許明細書を使って検証してみます。

Google Patentsで「半導体製造装置」というキーワードを入力し、最初に出てきたのが、「半導体製造装置、半導体製造装置の故障予知方法、および半導体製造装置の故障予知プログラム」と題するJP7093442B2でした。

この明細書の【0002】を使って検証したいと思います。当明細書の文章は、翻訳者である私から見て標準的なクオリティという印象です。実際にいろんな国に出願されていますが、外国出願を念頭に置いた文体でないのは明らかです。

【原文】
従来、半導体ウェハやプリント基板等の基板の表面に配線やバンプ(突起状電極)等を形成したりすることが行われている。この配線及びバンプ等を形成する方法として、電解めっき法が知られている。電解めっきを行うめっき装置には、モータで駆動される機構が複数含まれる。このようなモータは、めっき装置の使用に伴う経年劣化等に伴い、モータ負荷率が増加することが知られている。モータ負荷率が許容値を超えた場合、モータはエラーを出して動かなくなる。これは、装置の通常稼動中に突然発生するため、それ以降の装置稼動ができなくなり、めっき処理中の基板がスクラップとなる。

この原文を、翻訳者である私が、できあがる英文をある程度想定しながらプリエディットした結果が下記のものです。日本語としての違和感をなるべく出さないように配慮しました。

図: プリエディットした原文

原文をそのまま機械翻訳にかけた結果と、プリエディット後の文章を機械翻訳にかけた結果を、原文と比較しやすいように1文ずつ区切って列記します。機械翻訳エンジンにはDeepLを使いました。

【原文1】
従来、半導体ウェハやプリント基板等の基板の表面に配線やバンプ(突起状電極)等を形成したりすることが行われている。
【プリエディットなし】
Conventionally, wiring, bumps (protruding electrodes), etc. are formed on the surface of substrates such as semiconductor wafers and printed circuit boards.
【プリエディットあり】
Conventionally, semiconductor wafers and printed circuit boards have had wiring, bumps (protruding electrodes), etc., formed on their surfaces.
【所感】
プリエディットによって主語を変えたことにより、文脈に合った自然な英文に生まれ変わりました。文法的にも問題ありませんし、後続文との結束も良好で、そのまま使えそうです。

【原文2】
この配線及びバンプ等を形成する方法として、電解めっき法が知られている。
【プリエディットなし】
Electrolytic plating is known as a method for forming these wirings and bumps.
【プリエディットあり】
Electrolytic plating is known as a method for forming these wirings and bumps.
【改訳例】
Known as a method for forming the wiring and bumps is electrolytic plating.
【所感】
この文にはプリエディットを施していません。wiringは不可算名詞なので、wiringsは良くないような気がします。wiring pattersなどに変えるとさらに良いかもしれません。

【原文3】
電解めっきを行うめっき装置には、モータで駆動される機構が複数含まれる。
【プリエディットなし】
Plating equipment for electrolytic plating includes several mechanisms driven by motors.
【プリエディットあり】
Electrolytic plating equipment is equipped with multiple motor drive mechanisms.
【改訳例】
An electrolytic plating device includes a plurality of motor-driven mechanisms.
【所感】
「電解めっきを行うめっき装置」のように、日本語が冗長だと、同じように冗長な英語が返されてしまいます。「装置」がequipmentと訳されていますが、この単語には複数形がないので、翻訳上はdeviceのほうが使いやすいでしょう。プリエディットによってincludes → is equipped withに変わってしまいましたが、特許明細書ではincludesが好まれるでしょう。全体としては、やはり【プリエディットあり】の訳文のほうが優れています。

【原文4】
このようなモータは、めっき装置の使用に伴う経年劣化等に伴い、モータ負荷率が増加することが知られている。
【プリエディットなし】
It is known that the motor load factor of such motors increases with age and deterioration due to use of the plating equipment.
【プリエディットあり】
It is known that such motors are subject to an increase in load factor due to aging and other factors associated with the use of the plating equipment.
【改訳例】
Such motors are known to be subject to an increase in load factor due to aging and other factors associated with the use of the plating device.
【所感】
プリエディットにより、「モータ」を主語とする英文に生まれ変わっており、文脈に合った自然な英文へと変貌しています。

【原文5】
モータ負荷率が許容値を超えた場合、モータはエラーを出して動かなくなる。
【プリエディットなし】
When the motor load factor exceeds the allowable value, the motor will emit an error and stop running.
【プリエディットあり】
When the load factor exceeds the allowable value, the motor will emit an error and stop working.
【改訳例】
When the load factor exceeds an allowable value, the motor will stop working with an error.
【所感】
主語の置き場所を変えても、結果への影響はありませんでした。

【原文6】
これは、装置の通常稼動中に突然発生するため、それ以降の装置稼動ができなくなり、めっき処理中の基板がスクラップとなる。
【プリエディットなし】
Since this occurs suddenly during normal operation of the equipment, the equipment cannot be operated thereafter, and the substrates being plated become scrap.
【プリエディットあり】
This failure occurs suddenly during normal operation of the equipment and the equipment cannot be operated thereafter. The substrate is scrapped during the plating process.
【改訳例】
This failure occurs suddenly during normal operation, disabling the device to operate thereafter. The substrate in the plating process is scrapped.
【所感】
原訳は原文と同じく冗長かつ不可解で、プリエディットが功を奏しているのは明らかです。

今回は実質6つの文で検証しただけですが、プリエディットは英訳において効果的な作業であると改めて感じました。現在のNMTは、論理的なエラーを解消したり、冗長な言い回しを簡潔な英語に直したりしてくれるわけではありません。そのため、純粋な和文をそのままNMTにかけても、出力される英文はあくまでも英語の姿をした和文に過ぎず、商品とは程遠いものです。

その一方で、現在のNMTは、入力された和文の内容をそれなりに精緻に英語で表現することはできるため、翻訳者が翻訳時に脳内で行っている変換の内容を文字に書き起こすと、まあそれなりにイメージに近い結果を返してきます。プリエディット作業で特に有効と感じるのが、主語の変換です。英文として自然な主語が立っていると、ポストエディットの労力が大きく減ります。

翻訳者にとっての収益性という観点からは、なかなか判断が難しいところです。脳内で行った変換処理の結果を文字に書き起こすことは、それなりに時間と労力を要します。上記のとおり、プリエディットを経て出力された英文がそのまま使えることは少なく、やはり何らかの手直しは必要です。プリエディットによって削減されるポストエディットの手間が、プリエディットにかかる手間に見合うかどうかは、プリエディットのクオリティをどこまで追求するかによって異なりますし、今後のNMTの進化も関わってくるでしょう。翻訳者の立場で言えば、脳内変換の結果を書き起こすという作業は、決して楽しいものではなく、速やかに翻訳に移れないというストレスもあります。

その一方で、翻訳者の脳内変換を可視化することには、情報を他者と共有できるという大きなメリットがあります。プリエディット後の明細書を弁理士と共有できれば、自身の明細書における冗長表現や、英訳されやすい文にするための主語の立て方、文の区切り方、「は」と「が」の使い分け方などを弁理士が自ら学ぶことができます。特許明細書では全体として「が」が上手く使えていない傾向が見られますが、「は」と「が」を使い分けは、冠詞「a」と「the」の選択に影響します。その学びを自身の明細書に反映すれば、書き起こしから翻訳までのワークフロー全体が改善され、明細書の品質向上と翻訳完了までの期間の短縮、さらには翻訳品質の向上も期待できます。加えて、研修中または経験の浅い翻訳者が事務所内にいる場合には、翻訳者によるプリエディット後の明細書が格好の学習教材となります。そういう意味で、原文のプリエディットには社会的な意義があるように思います。

この「特許明細書の原文プリエディット」に事業性があるかどうかわかりませんが、上記の結果を見れば、効果があることは明らかです。もし、ちょっと自社の明細書で試してみたいという方がいらっしゃれば、お気軽にご相談ください。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA