arXiv reaDer
LAVAE:位置と外観のほぐし
LAVAE: Disentangling Location and Appearance
  視覚的シーンの構造化された、解釈可能な、オブジェクトベースの表現の教師なし学習のための確率的生成モデルを提案します。償却された変分推論を使用して、生成モデルをエンドツーエンドでトレーニングします。学習したオブジェクトの位置と外観の表現は完全に解かれ、オブジェクトは潜在空間で互いに独立して表現されます。位置と外観を解く以前のアプローチとは異なり、私たちのアプローチは、トレーニング体制で遭遇するよりもはるかに多くのオブジェクトを持つシーンにシームレスに一般化します。マルチMNISTおよびマルチdSpritesデータセットで提案されたモデルを評価します。
We propose a probabilistic generative model for unsupervised learning of structured, interpretable, object-based representations of visual scenes. We use amortized variational inference to train the generative model end-to-end. The learned representations of object location and appearance are fully disentangled, and objects are represented independently of each other in the latent space. Unlike previous approaches that disentangle location and appearance, ours generalizes seamlessly to scenes with many more objects than encountered in the training regime. We evaluate the proposed model on multi-MNIST and multi-dSprites data sets.
updated: Fri Sep 27 2019 00:10:09 GMT+0000 (UTC)
published: Wed Sep 25 2019 23:33:14 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト