ジェネレーティブアドバサリアルネットワーク(GAN)は画像合成タスクで大きな成功を収めていますが、トレーニング中の不安定さとハイパーパラメーターへの感度が原因で、さまざまなデータセットに適応することは非常に困難です。この不安定性の一般的に受け入れられている理由の1つは、実際の分布と偽の分布のサポートに十分なオーバーラップがない場合、弁別子からジェネレーターに渡される勾配が情報を提供しなくなることです。この作業では、マルチスケールグラディエント生成敵対的ネットワーク(MSG-GAN)を提案します。これは、弁別器からジェネレーターへの勾配を複数のスケールで流せるようにすることで、これに対処するためのシンプルで効果的な手法です。この手法は、高解像度の画像合成のための安定したアプローチを提供し、一般的に使用されるプログレッシブ成長手法の代替として機能します。 MSG-GANは、サイズ、解像度、ドメインが異なるさまざまな画像データセット、およびさまざまな種類の損失関数とアーキテクチャに、すべて同じ固定ハイパーパラメータで安定して収束することを示しています。最先端のGANと比較すると、私たちのアプローチは、私たちが試みたほとんどのケースでパフォーマンスに匹敵するか、それを超えています。
While Generative Adversarial Networks (GANs) have seen huge successes in image synthesis tasks, they are notoriously difficult to adapt to different datasets, in part due to instability during training and sensitivity to hyperparameters. One commonly accepted reason for this instability is that gradients passing from the discriminator to the generator become uninformative when there isn't enough overlap in the supports of the real and fake distributions. In this work, we propose the Multi-Scale Gradient Generative Adversarial Network (MSG-GAN), a simple but effective technique for addressing this by allowing the flow of gradients from the discriminator to the generator at multiple scales. This technique provides a stable approach for high resolution image synthesis, and serves as an alternative to the commonly used progressive growing technique. We show that MSG-GAN converges stably on a variety of image datasets of different sizes, resolutions and domains, as well as different types of loss functions and architectures, all with the same set of fixed hyperparameters. When compared to state-of-the-art GANs, our approach matches or exceeds the performance in most of the cases we tried.