画像変換はコンピュータビジョンの急成長分野であり、入力画像と出力画像の間のマッピングを学習することを目的としています。ただし、最新の方法では、さまざまなドメインマッピングをモデル化するために複数のジェネレーターが必要です。これは、一部のマルチドメイン画像変換タスクでは非効率的で非効率的です。この論文では、単一のジェネレータでマルチドメインの画像から画像への変換を実行するための新しい方法であるSingleGANを提案します。ドメインコードを導入して、さまざまな生成タスクを明示的に制御し、複数の最適化目標を統合して翻訳を確実にします。いくつかの対になっていないデータセットの実験結果は、2つのドメイン間の翻訳におけるモデルの優れたパフォーマンスを示しています。さらに、1対多のドメイン翻訳、多対多のドメイン翻訳、マルチモダリティでの1対1のドメイン翻訳など、さまざまなタスクのためのSingleGANのバリアントを探索します。拡張実験は、モデルの普遍性と拡張性を示しています。
Image translation is a burgeoning field in computer vision where the goal is to learn the mapping between an input image and an output image. However, most recent methods require multiple generators for modeling different domain mappings, which are inefficient and ineffective on some multi-domain image translation tasks. In this paper, we propose a novel method, SingleGAN, to perform multi-domain image-to-image translations with a single generator. We introduce the domain code to explicitly control the different generative tasks and integrate multiple optimization goals to ensure the translation. Experimental results on several unpaired datasets show superior performance of our model in translation between two domains. Besides, we explore variants of SingleGAN for different tasks, including one-to-many domain translation, many-to-many domain translation and one-to-one domain translation with multimodality. The extended experiments show the universality and extensibility of our model.