arXiv reaDer
Momentum Contrastive Autoencoder:WAEでの潜在空間分布マッチングのための対照学習の使用
Momentum Contrastive Autoencoder: Using Contrastive Learning for Latent Space Distribution Matching in WAE
ワッサースタインオートエンコーダー(WAE)は、2つの分布を一致させることは、このAEの潜在空間が事前に指定された事前分布と一致するという制約の下で、単純なオートエンコーダー(AE)の損失を最小限に抑えることと同等であることを示しています。この潜在的な空間分布のマッチングは、WAEのコアコンポーネントであり、困難な作業です。本論文では、この問題を解決する手段として、自己監視表現学習に効果的であることが示されている対照学習フレームワークを使用することを提案する。これは、対照的な学習目標が潜在空間分布を最適化して、簡単にサンプリングできる単位超球全体で均一になるという事実を利用することによって実現します。対照的な学習フレームワークを使用してWAE損失を最適化すると、WAEの既存の一般的なアルゴリズムと比較して、より高速な収束とより安定した最適化が実現されることを示します。これは、CelebAおよびCIFAR-10データセットのFIDスコア、およびCelebA-HQデータセットで生成された現実的な画質にも反映されます。
Wasserstein autoencoder (WAE) shows that matching two distributions is equivalent to minimizing a simple autoencoder (AE) loss under the constraint that the latent space of this AE matches a pre-specified prior distribution. This latent space distribution matching is a core component of WAE, and a challenging task. In this paper, we propose to use the contrastive learning framework that has been shown to be effective for self-supervised representation learning, as a means to resolve this problem. We do so by exploiting the fact that contrastive learning objectives optimize the latent space distribution to be uniform over the unit hyper-sphere, which can be easily sampled from. We show that using the contrastive learning framework to optimize the WAE loss achieves faster convergence and more stable optimization compared with existing popular algorithms for WAE. This is also reflected in the FID scores on CelebA and CIFAR-10 datasets, and the realistic generated image quality on the CelebA-HQ dataset.
updated: Tue Oct 19 2021 22:55:47 GMT+0000 (UTC)
published: Tue Oct 19 2021 22:55:47 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト