Stabilizing GANs with Soft Octave Convolutions
畳み込みの周波数分解を使用する最近公開された方法(オクターブ畳み込みなど)に動機付けられて、トレーニングを安定させ、モード崩壊の可能性を減らすための新しい畳み込みスキームを提案します。私たちのアプローチの基本的な考え方は、トレーニング中に重みの更新を低から高にシフトしながら、畳み込みフィルターを加算的な高周波数部分と低周波数部分に分割することです。直感的に、この方法は、GANに、細かい(高周波)詳細に降りる前に、低周波の粗い画像構造を学習させる。また、提案されたソフトオクターブ畳み込みを使用すると、生成された画像の周波数領域で一般的なアーティファクトが減少することも示します。私たちのアプローチは直交しており、既存の安定化手法を補完するものであり、CNNベースのGANアーキテクチャに簡単にプラグインできます。 CelebAデータセットでの実験は、提案された方法の有効性を示しています。
Motivated by recently published methods using frequency decompositions of convolutions (e.g. Octave Convolutions), we propose a novel convolution scheme to stabilize the training and reduce the likelihood of a mode collapse. The basic idea of our approach is to split convolutional filters into additive high and low frequency parts, while shifting weight updates from low to high during the training. Intuitively, this method forces GANs to learn low frequency coarse image structures before descending into fine (high frequency) details. We also show, that the use of the proposed soft octave convolutions reduces common artifacts in the frequency domain of generated images. Our approach is orthogonal and complementary to existing stabilization methods and can simply be plugged into any CNN based GAN architecture. Experiments on the CelebA dataset show the effectiveness of the proposed method.
updated: Thu Dec 17 2020 15:49:57 GMT+0000 (UTC)
published: Wed May 29 2019 15:28:54 GMT+0000 (UTC)
