訳語の一貫性確保は、特許翻訳に限らず、産業翻訳全般に求められる大切な要件です。interface という単語が同じ文書の中で「インターフェイス」、「インタフェース」、「インターフェース」とバラバラに表記されているのは見苦しいですし、computing device が、ある箇所で「計算装置」と訳され、別の箇所では「コンピューティングデバイス」と訳されていたら、読み手に別のものと認識される恐れがあります。

翻訳対象文書が何千ワード以上というボリュームの場合に、人間の記憶と注意力に頼るのは危険と言うよりただの無謀です。

注意力散漫、集中力欠乏症を自認する私は、もとよりミスの多いタイプの翻訳者でしたので、翻訳者としての競争力を付けるために、この問題を、あてにならない自分の注意力に頼らず、コンピュータに担わせることに長年腐心し、ワークフローを少しずつ改善してきました。

そのワークフローは、決して完成しているわけではなく、現在も発展途上なのですが、当社がこれまでに培ったその翻訳プロセスの現在形を、「HYBRID HARD DISK DRIVE, COMPUTER SYSTEM INCLUDING THE SAME, AND FLASH MEMORY DMA CIRCUIT FOR HYBRID HDD」と題する米国特許第2008-0177938号を例に紹介します。

まずは下の画像を見てください。これは翻訳前の原文の一部です。見やすくするために、段落構成などを少し加工してあります。発明の名称が小文字になっているのは、処理の便宜が理由です。

us20080177938

1. 頻出語句の抽出

あるツールを使って、明細書全体から2度以上使われている名詞句を抽出します。機械的に抽出するため、どうしてもゴミが混じりますが、非常に洗練されたアルゴリズムを使用しており、かなり高い精度で抽出することができます。

明細書を適宜参照しながらゴミを取り除き、頻出語句のリストを作ります。このリストの出来が翻訳の品質を大きく左右するため、リスト作りは慎重に行います。この作業に要する時間は、1万ワードの明細書で30~45分くらいです。下の画像は、ゴミを取り除いた後のリストです。出現回数も出ますので、類似案件の検索に便利です。

frequent_terms

2. キーワードのマーキング

頻出語句リストが完成したら、あるツールを使い、明細書上でこれらの語句を水色でマーキングして、下の画像のような状態にします。マーキング処理に要する時間はほんの1分ほどです。

blue_marker

3. 頻出動詞句のマーキング

次に行うのは、案件を問わず特許明細書に頻出する動詞句や副詞句のマーキングです。自社で用意している頻出語句リストをあるツールに読み込み、先ほどのファイルに適用してグレーでマーキングします。下の画像に示すようなファイルができ上がります。

glay_marker

4. 汎用語彙のマーキング

その次に行うのは、案件を問わず特許明細書に頻出する名詞句のマーキングです。自社で用意している頻出語句リストを再びあるツールに読み込み、先ほどのファイルに適用して黄緑色でマーキングします。下に示すファイルが、マーキング後の状態です。3色できれいに色分けされました。

green_marker

5. 翻訳不要文字列のマーキング

次に行うのは、数字や大文字など、訳す必要のない文字列のマーキングです。この処理にはWORDマクロを使うのですが、数字の誤記は致命傷になりますから、数字を認識しやすくするために、「1」とそれ以外で色を変えています。処理が終わった状態を下図に示します。

colored_nums

ここまでで前処理工程の半分です。

恐れ入りますが、この先は有料とさせていただきます。続きが気になる方は、PayPalまたはクレジットカードにて、所定の料金をお支払いください。