arXiv reaDer
DuDGAN: 二重拡散によるクラス条件付き GAN の改善
DuDGAN: Improving Class-Conditional GANs via Dual-Diffusion
敵対的生成ネットワーク (GAN) を使用したクラス条件付き画像生成は、さまざまな手法を通じて研究されています。ただし、モードの崩壊、トレーニングの不安定性、クラス内変動が大きいデータセットの場合の出力の低品質などの課題に引き続き直面しています。さらに、ほとんどの GAN は、より大きな反復で収束することが多く、その結果、トレーニング手順の反復効率が低くなります。 Diffusion-GAN は現実的なサンプルを生成する可能性を示していますが、クラス条件付きサンプルの生成には重大な制限があります。これらの制限を克服するために、二重拡散ベースのノイズ注入プロセスを組み込んだ DuDGAN と呼ばれる GAN を使用したクラス条件付き画像生成の新しいアプローチを提案します。私たちの方法は、弁別器、生成器、分類器という 3 つの独自のネットワークで構成されています。トレーニング プロセス中に、ガウス混合ノイズが 2 つのノイズ認識ネットワーク、弁別器と分類器に別々の方法で注入されます。このノイズの多いデータは、より困難なタスクを徐々に導入することで過学習を防止し、モデルのパフォーマンスの向上につながります。その結果、私たちの方法は、パフォーマンスの点で画像生成用の最先端の条件付き GAN モデルよりも優れています。私たちは AFHQ、Food-101、CIFAR-10 データセットを使用してメソッドを評価し、比較モデルと比較して FID、KID、精度、再現率スコアなどの指標全体で優れた結果を観察し、私たちのアプローチの有効性を強調しました。
Class-conditional image generation using generative adversarial networks (GANs) has been investigated through various techniques; however, it continues to face challenges such as mode collapse, training instability, and low-quality output in cases of datasets with high intra-class variation. Furthermore, most GANs often converge in larger iterations, resulting in poor iteration efficacy in training procedures. While Diffusion-GAN has shown potential in generating realistic samples, it has a critical limitation in generating class-conditional samples. To overcome these limitations, we propose a novel approach for class-conditional image generation using GANs called DuDGAN, which incorporates a dual diffusion-based noise injection process. Our method consists of three unique networks: a discriminator, a generator, and a classifier. During the training process, Gaussian-mixture noises are injected into the two noise-aware networks, the discriminator and the classifier, in distinct ways. This noisy data helps to prevent overfitting by gradually introducing more challenging tasks, leading to improved model performance. As a result, our method outperforms state-of-the-art conditional GAN models for image generation in terms of performance. We evaluated our method using the AFHQ, Food-101, and CIFAR-10 datasets and observed superior results across metrics such as FID, KID, Precision, and Recall score compared with comparison models, highlighting the effectiveness of our approach.
updated: Tue Jun 06 2023 06:35:25 GMT+0000 (UTC)
published: Wed May 24 2023 07:59:44 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト