Neural Machine Translation by Jointly Learning to Align and Translate
ニューラル機械翻訳は、最近提案された機械翻訳のアプローチである。従来の統計的機械翻訳とは異なり、ニューラル機械翻訳は、翻訳性能を最大化するために共同で調整できる単一のニューラルネットワークを構築することを目的としている。最近提案されているニューラル機械翻訳のモデルは、多くの場合、エンコーダ-デコーダのファミリーに属し、原文を固定長のベクトルにエンコードするエンコーダと、そこから翻訳を生成するデコーダから構成されている。本論文では、固定長ベクトルの使用がこの基本的なエンコーダ-デコーダ アーキテクチャの性能向上のボトルネックになっていると考え、これを拡張して、原文の中から目的語の予測に関連する部分を、ハードセグメントとして明示的に形成しなくても自動的に(柔軟な)検索ができるようにすることを提案する。この新しいアプローチにより、英語からフランス語への翻訳において、既存のフレーズベースのシステムと同等の翻訳性能を達成した。さらに、定性分析の結果、このモデルによって得られた(柔軟な)配置は、我々の直感とよく一致していることが明らかになった。
Neural machine translation is a recently proposed approach to machine translation. Unlike the traditional statistical machine translation, the neural machine translation aims at building a single neural network that can be jointly tuned to maximize the translation performance. The models proposed recently for neural machine translation often belong to a family of encoder-decoders and consists of an encoder that encodes a source sentence into a fixed-length vector from which a decoder generates a translation. In this paper, we conjecture that the use of a fixed-length vector is a bottleneck in improving the performance of this basic encoder-decoder architecture, and propose to extend this by allowing a model to automatically (soft-)search for parts of a source sentence that are relevant to predicting a target word, without having to form these parts as a hard segment explicitly. With this new approach, we achieve a translation performance comparable to the existing state-of-the-art phrase-based system on the task of English-to-French translation. Furthermore, qualitative analysis reveals that the (soft-)alignments found by the model agree well with our intuition.
updated: Thu May 19 2016 21:53:22 GMT+0000 (UTC)
published: Mon Sep 01 2014 16:33:02 GMT+0000 (UTC)
