arXiv reaDer
スペクトル正規化がGANを安定させる理由:分析と改善
Why Spectral Normalization Stabilizes GANs: Analysis and Improvements
スペクトル正規化(SN)は、生成的敵対的ネットワーク(GAN)の安定性とサンプル品質を向上させるために広く使用されている手法です。ただし、現在、SNが効果的である理由についての理解は限られています。この作業では、SNがGANトレーニングの2つの重要な障害モードである勾配の爆発と消失を制御することを示します。私たちの証明は、成功したLeCun初期化との(おそらく意図的ではない)接続を示しています。この接続は、GAN用のSNの最も一般的な実装がハイパーパラメータの調整を必要としない理由を説明するのに役立ちますが、SNのより厳密な実装では、すぐに使用できる経験的パフォーマンスが低くなります。トレーニングの開始時に勾配消失のみを制御するLeCun初期化とは異なり、SNはトレーニング全体を通じてこのプロパティを保持します。この理論的理解に基づいて、新しいスペクトル正規化手法を提案します。双方向スケーリングスペクトル正規化(BSSN)は、LeCun初期化のその後の改善からの洞察を組み込んでいます:Xavier初期化とKaiming初期化。理論的には、BSSNがSNよりも優れた勾配制御を提供することを示します。経験的に、いくつかのベンチマークデータセットでサンプル品質とトレーニングの安定性においてSNよりも優れていることを示しています。
Spectral normalization (SN) is a widely-used technique for improving the stability and sample quality of Generative Adversarial Networks (GANs). However, there is currently limited understanding of why SN is effective. In this work, we show that SN controls two important failure modes of GAN training: exploding and vanishing gradients. Our proofs illustrate a (perhaps unintentional) connection with the successful LeCun initialization. This connection helps to explain why the most popular implementation of SN for GANs requires no hyper-parameter tuning, whereas stricter implementations of SN have poor empirical performance out-of-the-box. Unlike LeCun initialization which only controls gradient vanishing at the beginning of training, SN preserves this property throughout training. Building on this theoretical understanding, we propose a new spectral normalization technique: Bidirectional Scaled Spectral Normalization (BSSN), which incorporates insights from later improvements to LeCun initialization: Xavier initialization and Kaiming initialization. Theoretically, we show that BSSN gives better gradient control than SN. Empirically, we demonstrate that it outperforms SN in sample quality and training stability on several benchmark datasets.
updated: Thu Apr 08 2021 00:29:30 GMT+0000 (UTC)
published: Sun Sep 06 2020 16:51:42 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト