dp-GAN : Alleviating Mode Collapse in GAN via Diversity Penalty Module
バニラGAN [5]はモード崩壊に深く悩まされています。これは通常、対応する潜在ベクトルが非常に異なっていても、ジェネレーターによって生成された画像がそれらの間で高い類似性を持つ傾向があることとして現れます。この論文では、GANのモード崩壊を緩和するために、ダイバーシティペナルティ(dp)と呼ばれるプラグ可能なブロックを紹介します。これは、特徴空間内の画像ペアの類似性を減らすために使用されます。つまり、2つの潜在ベクトルが異なる場合、ジェネレータを強制して、特徴が異なる2つの画像を生成します。正規化されたグラム行列は、類似性を測定するために使用されます。提案された方法を2D合成データセットでUnrolledGAN [17]、BourGAN [26]、PacGAN [14]、VEEGAN [23]、ALI [4]と比較し、結果は、提案された方法がGANがより多くのモードをキャプチャするのに役立つことを示していますデータ分布。さらに、このペナルティ項をMNIST、Fashion-MNIST、CIFAR-10の画像データ拡張に適用し、テスト精度はWGAN GP [6]と比較してそれぞれ0.24%、1.34%、0.52%向上しています。最後に、CelebA、CIFAR-10、MNIST、Fashion-MNISTでISとFIDを使用して提案された方法を定量的に評価します。結果は、いくつかの現在のGANアーキテクチャと比較して、私たちの方法がはるかに高いISと低いFIDを取得することを示しています。
The vanilla GAN [5] suffers from mode collapse deeply, which usually manifests as that the images generated by generators tend to have a high similarity amongst them, even though their corresponding latent vectors have been very different. In this paper, we introduce a pluggable block called diversity penalty (dp) to alleviate mode collapse of GANs. It is used to reduce the similarity of image pairs in feature space, i.e., if two latent vectors are different, then we enforce the generator to generate two images with different features. The normalized Gram Matrix is used to measure the similarity. We compare the proposed method with Unrolled GAN [17], BourGAN [26], PacGAN [14], VEEGAN [23] and ALI [4] on 2D synthetic dataset, and results show that our proposed method can help GAN capture more modes of the data distribution. Further, we apply this penalty term into image data augmentation on MNIST, Fashion-MNIST and CIFAR-10, and the testing accuracy is improved by 0.24%, 1.34% and 0.52% compared with WGAN GP [6], respectively. Finally, we quantitatively evaluate the proposed method with IS and FID on CelebA, CIFAR-10, MNIST and Fashion-MNIST. Results show that our method gets much higher IS and lower FID compared with some current GAN architectures.
updated: Thu Aug 05 2021 03:41:14 GMT+0000 (UTC)
published: Thu Aug 05 2021 03:41:14 GMT+0000 (UTC)
