arXiv reaDer
条件付きGANは明示的に条件付きですか?
Are conditional GANs explicitly conditional?
このホワイトペーパーでは、このアーキテクチャを活用するさまざまなアプリケーションを改善するための、条件付き生成的敵対的ネットワーク(cGAN)の2つの重要な貢献を提案します。最初の主な貢献は、cGANの分析であり、明示的に条件付きではないことを示しています。特に、ディスクリミネーターとそれに続くcGANが入力間の条件を自動的に学習しないことが示されます。 2番目の貢献は、contrario cGANと呼ばれる新しい方法であり、無条件(逆)の例を学習するように弁別子をトレーニングすることを含む新しいcontrario損失を介して、敵対的アーキテクチャの両方の部分の条件を明示的にモデル化します。これは、GANの新しいタイプのデータ拡張アプローチ(逆学習)につながり、逆の例を使用してジェネレーターの検索スペースを条件付き出力に制限することができます。確率分布分析を提案することにより、弁別器の条件性を評価するために、広範な実験が実行されます。さまざまなアプリケーションのcGANアーキテクチャとの比較により、セマンティック画像合成、画像セグメンテーション、単眼深度予測、FréchetInceptionDistance(FID)などのさまざまなメトリックを使用した画像への「単一ラベル」など、よく知られたデータセットのパフォーマンスが大幅に向上することが示されています。ユニオン上の交差(mIoU)、二乗平均平方根誤差ログ(RMSEログ)、および統計的に異なるビンの数(NDB)。
This paper proposes two important contributions for conditional Generative Adversarial Networks (cGANs) to improve the wide variety of applications that exploit this architecture. The first main contribution is an analysis of cGANs to show that they are not explicitly conditional. In particular, it will be shown that the discriminator and subsequently the cGAN does not automatically learn the conditionality between inputs. The second contribution is a new method, called a contrario cGAN, that explicitly models conditionality for both parts of the adversarial architecture via a novel a contrario loss that involves training the discriminator to learn unconditional (adverse) examples. This leads to a novel type of data augmentation approach for GANs (a contrario learning) which allows to restrict the search space of the generator to conditional outputs using adverse examples. Extensive experimentation is carried out to evaluate the conditionality of the discriminator by proposing a probability distribution analysis. Comparisons with the cGAN architecture for different applications show significant improvements in performance on well known datasets including, semantic image synthesis, image segmentation, monocular depth prediction and "single label"-to-image using different metrics including Fréchet Inception Distance (FID), mean Intersection over Union (mIoU), Root Mean Square Error log (RMSE log) and Number of statistically-Different Bins (NDB).
updated: Thu Mar 03 2022 10:36:31 GMT+0000 (UTC)
published: Mon Jun 28 2021 22:49:27 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト