クロスドメインの画像から画像への変換のための条件付き敵対的生成ネットワーク(GAN)は、近年大きな進歩を遂げている。タスクの複雑さにもよるが、条件付きGANを訓練するためには、数千から数百万のラベル付けされた画像ペアが必要である。しかし、人間によるラベリングはコストが高く、非現実的であることもあり、大量のデータが常に利用できるとは限らない。自然言語翻訳からの二重学習に着想を得て、我々は、2つのドメインからのラベル付けされていない画像の2つのセットから画像変換器を訓練することを可能にする新しい二重GANメカニズムを開発する。我々のアーキテクチャでは、プライマルGANはドメインUからドメインVの画像を変換することを学習し、デュアルGANはこのタスクを反転することを学習する。原始タスクとデュアルタスクによって作られた閉ループによって、どちらかのドメインからの画像を変換して再構成することができる。したがって、画像の再構成誤差を考慮した損失関数を変換器の訓練に使用することができる。ラベル付けされていないデータを用いた複数の画像翻訳タスクの実験では、単一のGANと比較してDualGANの性能が大幅に向上していることがわかる。いくつかのタスクでは、DualGANは完全にラベル付けされたデータで訓練された条件付きGANと比較して、同等またはわずかに良い結果を得ることができる。
Conditional Generative Adversarial Networks (GANs) for cross-domain image-to-image translation have made much progress recently. Depending on the task complexity, thousands to millions of labeled image pairs are needed to train a conditional GAN. However, human labeling is expensive, even impractical, and large quantities of data may not always be available. Inspired by dual learning from natural language translation, we develop a novel dual-GAN mechanism, which enables image translators to be trained from two sets of unlabeled images from two domains. In our architecture, the primal GAN learns to translate images from domain U to those in domain V, while the dual GAN learns to invert the task. The closed loop made by the primal and dual tasks allows images from either domain to be translated and then reconstructed. Hence a loss function that accounts for the reconstruction error of images can be used to train the translators. Experiments on multiple image translation tasks with unlabeled data show considerable performance gain of DualGAN over a single GAN. For some tasks, DualGAN can even achieve comparable or slightly better results than conditional GAN trained on fully labeled data.