arXiv reaDer
対照的な潜在変数によるエネルギーベースのモデルのガイド
Guiding Energy-based Models via Contrastive Latent Variables
エネルギーベース モデル (EBM) は、明示的な密度とアーキテクチャの柔軟性の両方を提供する一般的な生成フレームワークですが、不安定で時間がかかることが多いため、トレーニングは困難です。近年、さまざまなトレーニング手法が開発されました。たとえば、発散対策の改善や MCMC サンプリングの安定化などです。しかし、EBM と GAN などの他の生成フレームワークとの間には、生成品質の点で大きなギャップが存在することがよくあります。この論文では、対照表現学習 (CRL) を介して EBM を改善するための斬新で効果的なフレームワークを提案します。具体的には、対照的な方法によって学習された表現を真の潜在変数と見なします。この対照的な潜在変数は、EBM がデータ構造をよりよく理解するように導く可能性があるため、EBM トレーニングを大幅に改善および加速できます。 EBM と CRL の共同トレーニングを可能にするために、データの共同密度と対照的な潜在変数を学習するための潜在変数 EBM の新しいクラスも設計します。私たちの実験結果は、大幅に高速でメモリ効率の高いトレーニングを行っても、従来技術の EBM 方法 (たとえば、さらに変分オートエンコーダまたは拡散技術を使用) と比較して、私たちのスキームが低い FID スコアを達成することを示しています。また、明示的な条件付きトレーニングがなくても、潜在変数 EBM の条件付きおよび構成生成能力を追加の利点として示します。コードは https://github.com/hankook/CLEL で入手できます。
An energy-based model (EBM) is a popular generative framework that offers both explicit density and architectural flexibility, but training them is difficult since it is often unstable and time-consuming. In recent years, various training techniques have been developed, e.g., better divergence measures or stabilization in MCMC sampling, but there often exists a large gap between EBMs and other generative frameworks like GANs in terms of generation quality. In this paper, we propose a novel and effective framework for improving EBMs via contrastive representation learning (CRL). To be specific, we consider representations learned by contrastive methods as the true underlying latent variable. This contrastive latent variable could guide EBMs to understand the data structure better, so it can improve and accelerate EBM training significantly. To enable the joint training of EBM and CRL, we also design a new class of latent-variable EBMs for learning the joint density of data and the contrastive latent variable. Our experimental results demonstrate that our scheme achieves lower FID scores, compared to prior-art EBM methods (e.g., additionally using variational autoencoders or diffusion techniques), even with significantly faster and more memory-efficient training. We also show conditional and compositional generation abilities of our latent-variable EBMs as their additional benefits, even without explicit conditional training. The code is available at https://github.com/hankook/CLEL.
updated: Mon Mar 06 2023 10:50:25 GMT+0000 (UTC)
published: Mon Mar 06 2023 10:50:25 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト