arXiv reaDer
NP-DRAW:画像生成のためのノンパラメトリック構造化潜在変数モデル
NP-DRAW: A Non-Parametric Structured Latent Variable Model for Image Generation
この論文では、NP-DRAWと呼ばれる、画像生成のためのノンパラメトリック構造化潜在変数モデルを提示します。これは、部分ごとに潜在キャンバスに順次描画し、キャンバスから画像をデコードします。主な貢献は以下のとおりです。 1)ステップごとの潜在変数「何を描画するか」がカテゴリ確率変数になるように、画像パーツの外観に対するノンパラメトリック事前分布を提案します。これにより、表現力が向上し、文献で使用されているガウス分布に比べて学習が大幅に容易になります。 2)トランスフォーマーを介してパーツのシーケンシャル依存構造をモデル化します。トランスフォーマーは、文献で使用されているRNNと比較して、より強力でトレーニングが容易です。 3)事前トレーニングを行うための効果的なヒューリスティック解析アルゴリズムを提案します。 MNIST、Omniglot、CIFAR-10、およびCelebAでの実験は、私たちの方法がDRAWやAIRなどの以前の構造化画像モデルを大幅に上回り、他の一般的な生成モデルと競合することを示しています。さらに、モデルの固有の構成性と解釈可能性が、低データ学習体制と潜在空間編集に大きなメリットをもたらすことを示します。コードはhttps://github.com/ZENGXH/NPDRAWで入手できます。
In this paper, we present a non-parametric structured latent variable model for image generation, called NP-DRAW, which sequentially draws on a latent canvas in a part-by-part fashion and then decodes the image from the canvas. Our key contributions are as follows. 1) We propose a non-parametric prior distribution over the appearance of image parts so that the latent variable ``what-to-draw'' per step becomes a categorical random variable. This improves the expressiveness and greatly eases the learning compared to Gaussians used in the literature. 2) We model the sequential dependency structure of parts via a Transformer, which is more powerful and easier to train compared to RNNs used in the literature. 3) We propose an effective heuristic parsing algorithm to pre-train the prior. Experiments on MNIST, Omniglot, CIFAR-10, and CelebA show that our method significantly outperforms previous structured image models like DRAW and AIR and is competitive to other generic generative models. Moreover, we show that our model's inherent compositionality and interpretability bring significant benefits in the low-data learning regime and latent space editing. Code is available at https://github.com/ZENGXH/NPDRAW.
updated: Sun Jul 04 2021 18:44:43 GMT+0000 (UTC)
published: Fri Jun 25 2021 05:17:55 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト