Deep Generative Networks(DGN)は、Generative Adversarial Networks(GAN)、Variational Autoencoders(VAE)、およびそれらのバリアントで広く使用されており、データ多様体とその多様体でのデータ分散を近似します。ただし、トレーニングサンプルは、経験的データ分布でアーティファクトを生成する好み、コスト、または利便性に基づいて取得されることがよくあります。たとえば、CelebAデータセットの笑顔の大部分やFFHQの黒髪の個人の大部分などです。これらの不整合は、トレーニングされたDGNからサンプリングするときに再現されます。これは、公平性、データ拡張、異常検出、ドメイン適応などに広範囲にわたる潜在的な影響を及ぼします。それに応じて、微分幾何学ベースのサンプラー(造られたMaGNET)を開発します。これは、訓練されたDGNが与えられると、学習された多様体に均一に分布するサンプルを生成します。理論的および経験的に、トレーニングセットの分布に関係なく、私たちの手法がマニフォールド上に一様分布を生成することを証明します。さまざまなデータセットとDGNでさまざまな実験を行います。そのうちの1つは、FFHQデータセットでトレーニングされた最先端のStyleGAN2を検討しています。ここでは、MaGNETを介した均一なサンプリングにより、ラベルや再トレーニングを必要とせずに、分布の精度と再現率が4.1%と3.0%向上し、性別の偏りが41.2%減少します。
Deep Generative Networks (DGNs) are extensively employed in Generative Adversarial Networks (GANs), Variational Autoencoders (VAEs), and their variants to approximate the data manifold, and data distribution on that manifold. However, training samples are often obtained based on preferences, costs, or convenience producing artifacts in the empirical data distribution e.g., the large fraction of smiling faces in the CelebA dataset or the large fraction of dark-haired individuals in FFHQ. These inconsistencies will be reproduced when sampling from the trained DGN, which has far-reaching potential implications for fairness, data augmentation, anomaly detection, domain adaptation, and beyond. In response, we develop a differential geometry based sampler -- coined MaGNET -- that, given any trained DGN, produces samples that are uniformly distributed on the learned manifold. We prove theoretically and empirically that our technique produces a uniform distribution on the manifold regardless of the training set distribution. We perform a range of experiments on various datasets and DGNs. One of them considers the state-of-the-art StyleGAN2 trained on FFHQ dataset, where uniform sampling via MaGNET increases distribution precision and recall by 4.1% & 3.0% and decreases gender bias by 41.2%, without requiring labels or retraining.