これは、因子分析、確率的主成分分析(PCA)、変分推論、および変分オートエンコーダー(VAE)に関するチュートリアルと調査論文です。密接に関連しているこれらの方法は、次元削減と生成モデルです。彼らは、すべてのデータポイントが低次元の潜在因子から生成されるか、それによって引き起こされると想定しています。潜在空間の分布のパラメータを学習することにより、次元削減のために対応する低次元の要因が見つかります。それらの確率的で生成的な振る舞いのために、これらのモデルは、データ空間での新しいデータポイントの生成にも使用できます。このホワイトペーパーでは、まず、パラメータを学習するためのエビデンス下限(ELBO)と期待値最大化(EM)を導出する変分推論から始めます。次に、因子分析を導入し、その結合分布と周辺分布を導き出し、EMステップを計算します。次に、因子分析の特殊なケースとして確率的PCAについて説明し、その閉形式の解を導き出します。最後に、VAEについて、エンコーダー、デコーダー、および潜在空間からのサンプリングを紹介します。 EMとバックプロパゲーションの両方を使用したVAEのトレーニングについて説明します。
This is a tutorial and survey paper on factor analysis, probabilistic Principal Component Analysis (PCA), variational inference, and Variational Autoencoder (VAE). These methods, which are tightly related, are dimensionality reduction and generative models. They assume that every data point is generated from or caused by a low-dimensional latent factor. By learning the parameters of distribution of latent space, the corresponding low-dimensional factors are found for the sake of dimensionality reduction. For their stochastic and generative behaviour, these models can also be used for generation of new data points in the data space. In this paper, we first start with variational inference where we derive the Evidence Lower Bound (ELBO) and Expectation Maximization (EM) for learning the parameters. Then, we introduce factor analysis, derive its joint and marginal distributions, and work out its EM steps. Probabilistic PCA is then explained, as a special case of factor analysis, and its closed-form solutions are derived. Finally, VAE is explained where the encoder, decoder and sampling from the latent space are introduced. Training VAE using both EM and backpropagation are explained.