正確な対数尤度計算と潜在変数推論の両方の扱いやすさ、およびトレーニングとサンプリングの両方の効率により概念的に魅力的なフローベースの生成モデルは、多くの印象的な経験的成功をもたらし、多くの高度なバリアントと理論的調査を生み出しました。計算効率にもかかわらず、フローベースの生成モデルの密度推定性能は、最新の自己回帰モデルの密度推定性能に大幅に遅れています。この作業では、マスクされた畳み込みを使用した生成フローのシンプルかつ効果的なアーキテクチャである、マスクされた畳み込み生成フロー(MaCow)を紹介します。小さなカーネル内のローカル接続を制限することにより、MaCowは高速で安定したトレーニングと効率的なサンプリングの特性を享受しながら、標準画像ベンチマークでの密度推定のグローを大幅に改善し、自己回帰モデルへのギャップを大幅に狭めます。
Flow-based generative models, conceptually attractive due to tractability of both the exact log-likelihood computation and latent-variable inference, and efficiency of both training and sampling, has led to a number of impressive empirical successes and spawned many advanced variants and theoretical investigations. Despite their computational efficiency, the density estimation performance of flow-based generative models significantly falls behind those of state-of-the-art autoregressive models. In this work, we introduce masked convolutional generative flow (MaCow), a simple yet effective architecture of generative flow using masked convolution. By restricting the local connectivity in a small kernel, MaCow enjoys the properties of fast and stable training, and efficient sampling, while achieving significant improvements over Glow for density estimation on standard image benchmarks, considerably narrowing the gap to autoregressive models.