この作業では、データ分布の生成モデリングのアルゴリズムである、Generative Latent Flow(GLF)を提案します。 GLFは、オートエンコーダー(AE)を使用してデータの潜在表現を学習し、正規化フローを使用して潜在変数の分布を単純なi.i.dノイズの分布にマッピングします。エンコードされた潜在分布を事前分布に一致させるさまざまなレギュライザーを使用する他の自動エンコーダーベースの生成モデルとは対照的に、モデルはこれらの2つの分布間のマッピングを明示的に構築し、潜在の過剰な正則化を回避しながら、より良い密度マッチングを実現します変数。モデルをいくつかの関連技術と比較し、高速収束、単一段階のトレーニング、再構築の最小トレードオフなど、多くの相対的な利点があることを示します。また、モデルとその確率論的対応物との関係を研究し、モデルがVAEの消失するノイズ制限とフロー優先で見られることを示します。定量的に、標準化された評価の下で、私たちの方法は、一般的に使用されるデータセットのAEベースのモデル間で最先端のサンプル品質を達成し、GANのベンチマークと競合します。
In this work, we propose the Generative Latent Flow (GLF), an algorithm for generative modeling of the data distribution. GLF uses an Auto-encoder (AE) to learn latent representations of the data, and a normalizing flow to map the distribution of the latent variables to that of simple i.i.d noise. In contrast to some other Auto-encoder based generative models, which use various regularizers that encourage the encoded latent distribution to match the prior distribution, our model explicitly constructs a mapping between these two distributions, leading to better density matching while avoiding over regularizing the latent variables. We compare our model with several related techniques, and show that it has many relative advantages including fast convergence, single stage training and minimal reconstruction trade-off. We also study the relationship between our model and its stochastic counterpart, and show that our model can be viewed as a vanishing noise limit of VAEs with flow prior. Quantitatively, under standardized evaluations, our method achieves state-of-the-art sample quality among AE based models on commonly used datasets, and is competitive with GANs' benchmarks.