Generative Adversarial Networks(GAN)を使用した対になっていない画像から画像への変換は、複数のドメイン間で画像を変換することに成功しています。さらに、最近の研究では、発電機の出力を多様化する方法が示されています。ただし、ジェネレーターが結果を多様化する方法に制限がないため、いくつかの予期しない機能を変換する可能性があります。この論文では、スタイル制限付きGAN(SRGAN)を提案します。これは、入力画像をさまざまなスタイルのさまざまなドメインに転送し、クラス関連の機能のみを変更する新しいアプローチです。さらに、KL発散損失の代わりに、エンコードされた特徴の分布を制限する3つの新しい損失を採用します。バッチKL発散損失、相関損失、およびヒストグラム模倣損失です。この調査では、適合率、再現率、密度、およびカバレッジに関する定量的および定性的な結果が報告されています。提案された3つの損失は、従来のKL損失と比較して多様性のレベルの向上につながります。特に、SRGANは、CelebA顔データセットのクラスに関係のない機能を変更することなく、より多様性の高い翻訳に成功していることがわかりました。私たちの実装はhttps://github.com/shinshoji01/Style-Restricted_GANで入手できます。
Unpaired image-to-image translation using Generative Adversarial Networks (GAN) is successful in converting images among multiple domains. Moreover, recent studies have shown a way to diversify the outputs of the generator. However, since there are no restrictions on how the generator diversifies the results, it is likely to translate some unexpected features. In this paper, we propose Style-Restricted GAN (SRGAN), a novel approach to transfer input images into different domains' with different styles, changing the exclusively class-related features. Additionally, instead of KL divergence loss, we adopt 3 new losses to restrict the distribution of the encoded features: batch KL divergence loss, correlation loss, and histogram imitation loss. The study reports quantitative as well as qualitative results with Precision, Recall, Density, and Coverage. The proposed 3 losses lead to the enhancement of the level of diversity compared to the conventional KL loss. In particular, SRGAN is found to be successful in translating with higher diversity and without changing the class-unrelated features in the CelebA face dataset. Our implementation is available at https://github.com/shinshoji01/Style-Restricted_GAN.