arXiv reaDer
不偏な画像生成のための拡散モデルでの多様体ガイド サンプリング
Manifold-Guided Sampling in Diffusion Models for Unbiased Image Generation
拡散モデルは、高品質の画像を生成できる強力な生成モデルですが、データの偏りに悩まされる可能性があります。データの偏りは、トレーニング データがデータ ドメインの真の分布を反映しておらず、歪んだパターンや不均衡なパターンを示している場合に発生します。たとえば、CelebA データセットには男性の画像よりも女性の画像が多く含まれているため、生成結果が偏り、下流のアプリケーションに影響を与える可能性があります。この論文では、多様体ガイダンスを適用することで拡散モデルにおけるデータの偏りを軽減する新しい方法を提案します。私たちの重要なアイデアは、学習可能な情報理論的アプローチを使用してトレーニング データの多様体を推定し、それを拡散モデルのサンプリング プロセスのガイドに使用することです。このようにして、モデル アーキテクチャを変更したり、ラベルや再トレーニングを必要としたりすることなく、生成された画像がデータ マニホールド上に均一に分散されるように促すことができます。私たちは、標準的な拡散モデルと比較して、私たちの方法が画像生成の品質と不偏性を向上させることができることを示す理論的分析と経験的証拠を提供します。
Diffusion models are a powerful class of generative models that can produce high-quality images, but they may suffer from data bias. Data bias occurs when the training data does not reflect the true distribution of the data domain, but rather exhibits some skewed or imbalanced patterns. For example, the CelebA dataset contains more female images than male images, which can lead to biased generation results and affect downstream applications. In this paper, we propose a novel method to mitigate data bias in diffusion models by applying manifold guidance. Our key idea is to estimate the manifold of the training data using a learnable information-theoretic approach, and then use it to guide the sampling process of diffusion models. In this way, we can encourage the generated images to be uniformly distributed on the data manifold, without changing the model architecture or requiring labels or retraining. We provide theoretical analysis and empirical evidence to show that our method can improve the quality and unbiasedness of image generation compared to standard diffusion models.
updated: Mon Jul 17 2023 02:03:17 GMT+0000 (UTC)
published: Mon Jul 17 2023 02:03:17 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト