arXiv reaDer
コーシーシュワルツ正則化オートエンコーダ
Cauchy-Schwarz Regularized Autoencoder
教師なし学習の最近の研究は、潜在変数モデルでの効率的な推論と学習に焦点を合わせています。証拠(周辺尤度)を最大化することによってこれらのモデルをトレーニングすることは、通常、手に負えません。したがって、一般的な概算は、代わりにEvidence Lower BOund(ELBO)を最大化することです。変分オートエンコーダー(VAE)は、大規模なデータセットに対してELBOを効率的に最適化する、強力で広く使用されている生成モデルのクラスです。ただし、VAEの事前のデフォルトのガウス選択は、真の後方を表す能力に強い制約を課し、それによって全体的なパフォーマンスを低下させます。ガウス混合モデル(GMM)はより豊富な事前分布ですが、GMMのカルバックライブラー発散が扱いにくいため、VAEフレームワーク内で効率的に処理することはできません。この特定の点でVAEフレームワークの採用に異議を唱え、事前にガウス混合物の分析ソリューションを使用することを支持します。 GMM事前分布の効率的な推論を実行するために、GMMについて分析的に計算できる、コーシーシュワルツ発散に基づく新しい制約付き目的を導入します。この新しい目的により、より豊富なマルチモーダル事前分布を自動エンコードフレームワークに組み込むことができます。さまざまなデータセットに関する実証研究を提供し、密度推定、教師なしクラスタリング、半教師ありの変分自動エンコードモデルを改善することを示しています。教師あり学習、および顔分析。
Recent work in unsupervised learning has focused on efficient inference and learning in latent variables models. Training these models by maximizing the evidence (marginal likelihood) is typically intractable. Thus, a common approximation is to maximize the Evidence Lower BOund (ELBO) instead. Variational autoencoders (VAE) are a powerful and widely-used class of generative models that optimize the ELBO efficiently for large datasets. However, the VAE's default Gaussian choice for the prior imposes a strong constraint on its ability to represent the true posterior, thereby degrading overall performance. A Gaussian mixture model (GMM) would be a richer prior, but cannot be handled efficiently within the VAE framework because of the intractability of the Kullback-Leibler divergence for GMMs. We challenge the adoption of the VAE framework on this specific point in favor of one with an analytical solution for Gaussian mixture prior. To perform efficient inference for GMM priors, we introduce a new constrained objective based on the Cauchy-Schwarz divergence, which can be computed analytically for GMMs. This new objective allows us to incorporate richer, multi-modal priors into the auto-encoding framework.We provide empirical studies on a range of datasets and show that our objective improves upon variational auto-encoding models in density estimation, unsupervised clustering, semi-supervised learning, and face analysis.
updated: Wed Jan 06 2021 17:36:26 GMT+0000 (UTC)
published: Wed Jan 06 2021 17:36:26 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト