AI翻訳に関する私見(2)
- ito017
- 6月13日
- 読了時間: 4分
前回のブログで触れましたように、多くの翻訳者の仕事はAI翻訳をチェックして修正するMTPE (Machine Translation Post Editing:機械翻訳ポストエディット)に移行すると予想されています。
MTPE自体は特に新しいものではなく、AI翻訳が登場する前(ルールベース/統計ベースの機械翻訳の時代)から存在しました。しかし、当時の機械翻訳は修正すべき箇所が多すぎて、翻訳者の間では、MTPEより一から訳した方が早いという意見が圧倒的でした。
AI翻訳が優秀になるにつれて、「訳す」より「直す」方が効率がいいと考える人が増えるのは当然です。
以下ではMTPEについての個人的な見解を書きます。
まず、矛盾するようですが「MTPEの作業は絶対必要であると同時に、極力減らした方がいい」というのが私の個人的な考えです。特許文書は企業にとって極めて重要な文書ですから、不完全なAI翻訳のまま提出していいはずはなく、提出前に、言語・技術・法律の複数の専門家による精査が絶対に必要だという点は説明するまでもないでしょう。
ニューラル機械翻訳(NMT)は非常に流暢な訳文を生成する傾向がありますが、その流暢さゆえに、致命的な誤り(例:意味の反転、名詞の置換)がかえって見過ごされやすくなるという側面も指摘されています。このような背景から、特に品質要求水準の高い文書においては、誤訳、文法的な誤り、不自然な表現を修正し、原文のニュアンスをより適切に伝えるための人間によるポストエディット作業は、依然として重要な工程と言えます 。
この「絶対必要」を踏まえた上で、「極力減らした方がいい」理由を説明したいと思います。
まず、人間も間違いを犯しますから、ポストエディットの量が増えると、訳文に新たなミスが導入されたり、一貫性が損なわれたりする可能性が高まります。修正の際に修正の対象を消し忘れてしまう。複数形を単数形に変更したが、動詞を三単現にし忘れた。名詞を一括変換したために、不定冠詞「a/an」の整合性が失われた……。そんな経験は翻訳者なら誰でもあると思います。翻訳に限らず、明細書の作成においても、「最後に直した部分にミスが生じやすい」という点は、概ね賛同が得られると思います。
大量に編集を行えば、再びチェックをすることは必須であり、チェック→編集→チェック→編集のループが続くことになります。効率を高めるためのMTPEでこのループを繰り返すのは本末転倒な気がします。
長年翻訳をしていると、妙なこだわりが出てきます。例えば、私の場合、特許文書で頻出する「など」を「etc.」と訳さないというこだわりがあります。「など」については、「among other things」としてみたり、「such as」を使ってみたりして、「etc.」を回避してきたわけです。しかし、「etc.」を使うか使わないかというのは、ある種の「好み」の問題であり、「etc.」を「among other things」と書き換えたところで明細書の価値が上がるかは疑問です。このレベルのこだわりがあまりに強すぎると、AIの出力結果を大幅に直す必要が生じ、それが却ってミスや効率の低下を招くという事態は十分予想できます。
もちろん、「こだわり」が単なる「好み」ではなく、それなりの根拠がある場合もあります。根拠がある「こだわり」については捨てる必要はありません。ただし、正当な「こだわり」については、一々出力を直すのではなく、入力側(用語集、指示プロンプト)に含ませた方がいいと思います。対話型のAIであれば、「etc.を使わないで」と指示すれば、そのように出力してくれますから、あくまで入力側でチューニングした方が得策のように思えます(なお、プロンプトに「○○しないで」という否定的な指示を含ませるより、「○○の場合、××として」と具体的な指示を出した方が上手くいく場合が多いようです)。
AIへの指示を工夫することによって出力結果が向上したという経験は、次回の指示に生かせますから、「出力を直すより入力を直す」という基本的なスタンスは概ね正しいと思います。
さて、AIへの指示であるプロンプトには原稿も含まれます。「出力を直すより入力を直す」というスタンスを突き詰めると、「よりよい出力を得るために原稿を直す」という考えに行きつきます。翻訳者にとって原稿は聖典のようなものであり、翻訳者が勝手に原稿に手を入れることは許されません。ここから先は、原稿を準備する側の課題となります。次回のブログでは、AI翻訳のための原稿について考察したいと思います。
Comments