arXiv reaDer
条件付きGANをトレーニングする方法:幾何学的に構造化された潜在多様体を使用したアプローチ
How to train your conditional GAN: An approach using geometrically structured latent manifolds
条件付き生成モデリングでは、通常、入力と出力の間の1対多のマッピングをキャプチャする必要があります。ただし、バニラ条件付きGAN(cGAN)は、潜在シードの変動を無視する傾向があり、その結果、モードが崩壊します。解決策として、最近の研究は、条件付きの設定で多様な出力を生成するための比較的高価なモデルに移行しています。この論文では、バニラcGANの多様性が限られているのは、能力の不足によるものではなく、最適でないトレーニングスキームの結果であると主張します。幾何学的な観点からこの問題に取り組み、バニラcGANの多様性と視覚的品質の両方を向上させる新しいトレーニングメカニズムを提案します。提案されたソリューションは、アーキテクチャの変更を必要とせず、マルチモーダル空間での条件付き生成を対象とするより効率的なアーキテクチャへの道を開きます。さまざまなタスクセットに対するモデルの有効性を検証し、提案されたソリューションが複数のデータセットにわたって一般的で効果的であることを示します。
Conditional generative modeling typically requires capturing one-to-many mappings between the inputs and outputs. However, vanilla conditional GANs (cGAN) tend to ignore the variations of the latent seeds which results in mode-collapse. As a solution, recent works have moved towards comparatively expensive models for generating diverse outputs in a conditional setting. In this paper, we argue that the limited diversity of the vanilla cGANs is not due to a lack of capacity, but a result of non-optimal training schemes. We tackle this problem from a geometrical perspective and propose a novel training mechanism that increases both the diversity and the visual quality of the vanilla cGAN. The proposed solution does not demand architectural modifications and paves the way for more efficient architectures that target conditional generation in multi-modal spaces. We validate the efficacy of our model against a diverse set of tasks and show that the proposed solution is generic and effective across multiple datasets.
updated: Mon Nov 30 2020 06:00:21 GMT+0000 (UTC)
published: Wed Nov 25 2020 22:54:11 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト