arXiv reaDer
Lipschitz正則化はGANトレーニングにどのように影響しますか?
How does Lipschitz Regularization Influence GAN Training?
GANトレーニングの安定化におけるリプシッツの正規化の成功にもかかわらず、その有効性の正確な理由はよくわかっていません。 K-リプシッツの正則化の直接的な影響は、ニューラルネットワークの勾配のL2ノルムがしきい値K(たとえば、K = 1)よりも小さくなるように制限して、\ | \ nabla f \ | ≤K。この作業では、損失関数への影響を調べることにより、リプシッツ正則化のさらに重要な効果を明らかにします。これは、GAN損失関数を、達成可能な勾配値の領域と間隔を制限することにより、ほぼ線形関数に縮退します。私たちの分析では、損失関数は、ほぼ線形の関数に退化した場合にのみ成功することが示されています。また、損失関数は縮退していない場合はパフォーマンスが低下し、正則化によって十分に縮退している限り、損失関数として広範囲の関数を使用できることも示しています。基本的に、リプシッツの正則化は、すべての損失関数が同じ方法で効果的に機能することを保証します。経験的に、MNIST、CIFAR10、およびCelebAデータセットに関する提案を検証します。
Despite the success of Lipschitz regularization in stabilizing GAN training, the exact reason of its effectiveness remains poorly understood. The direct effect of K-Lipschitz regularization is to restrict the L2-norm of the neural network gradient to be smaller than a threshold K (e.g., K=1) such that \|\nabla f\| ≤K. In this work, we uncover an even more important effect of Lipschitz regularization by examining its impact on the loss function: It degenerates GAN loss functions to almost linear ones by restricting their domain and interval of attainable gradient values. Our analysis shows that loss functions are only successful if they are degenerated to almost linear ones. We also show that loss functions perform poorly if they are not degenerated and that a wide range of functions can be used as loss function as long as they are sufficiently degenerated by regularization. Basically, Lipschitz regularization ensures that all loss functions effectively work in the same way. Empirically, we verify our proposition on the MNIST, CIFAR10 and CelebA datasets.
updated: Tue Aug 25 2020 07:39:24 GMT+0000 (UTC)
published: Fri Nov 23 2018 17:18:00 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト