LayoutVAE: ラベル セットからの確率的シーン レイアウトの生成
LayoutVAE: Stochastic Scene Layout Generation From a Label Set
最近、研究コミュニティ内でシーン生成への関心が高まっています。ただし、テキスト記述からシーン レイアウトを生成するために使用されるモデルは、テキストによって指示される構造内のもっともらしい視覚的変化をほとんど無視します。確率的シーン レイアウトを生成するための変動オートエンコーダ ベースのフレームワークである LayoutVAE を提案します。 LayoutVAE は、ラベル セットを指定して完全な画像レイアウトを生成したり、新しいラベルを指定した既存の画像のラベルごとのレイアウトを生成したりできる多用途のモデリング フレームワークです。さらに、異常なレイアウトを検出することもでき、レイアウト生成の問題を評価する方法を提供する可能性があります。 MNIST-Layouts に関する広範な実験と挑戦的な COCO 2017 Panoptic データセットは、提案されたフレームワークの有効性を検証します。
Recently there is an increasing interest in scene generation within the research community. However, models used for generating scene layouts from textual description largely ignore plausible visual variations within the structure dictated by the text. We propose LayoutVAE, a variational autoencoder based framework for generating stochastic scene layouts. LayoutVAE is a versatile modeling framework that allows for generating full image layouts given a label set, or per label layouts for an existing image given a new label. In addition, it is also capable of detecting unusual layouts, potentially providing a way to evaluate layout generation problem. Extensive experiments on MNIST-Layouts and challenging COCO 2017 Panoptic dataset verifies the effectiveness of our proposed framework.
updated: Tue Jun 01 2021 06:25:20 GMT+0000 (UTC)
published: Wed Jul 24 2019 20:53:55 GMT+0000 (UTC)
