arXiv reaDer
GENESIS-V2:反復的な改良なしで順序付けられていないオブジェクト表現を推測する
GENESIS-V2: Inferring Unordered Object Representations without Iterative Refinement
オブジェクト中心の生成モデル(OCGM)の進歩は、教師なしオブジェクトのセグメンテーションと解釈可能なオブジェクト中心のシーン生成のための幅広い方法の開発に至りました。ただし、これらの方法は、視覚的な複雑さが制限されたシミュレートされた実際のデータセットに限定されています。さらに、オブジェクト表現は、大きな画像にうまくスケーリングしないRNNや、画像内のオブジェクトに不自然な順序を課すことを回避するが、固定数のオブジェクト表現を事前に初期化する必要がある反復的な改良を使用して推測されることがよくあります。確立されたパラダイムとは対照的に、この作業では、確率的でノンパラメトリックなスティックブレイクプロセスを使用して、ピクセルの埋め込みを微分可能な方法でクラスター化する埋め込みベースのアプローチを提案します。反復的な改良と同様に、このクラスタリング手順もランダムに順序付けられたオブジェクト表現につながりますが、固定数のクラスターを事前に初期化する必要はありません。これは、RNNや反復的な改良を使用せずに可変数のオブジェクト表現を推測できる新しいモデルGENESIS-V2を開発するために使用されます。 GENESIS-V2は、確立された合成データセットやより複雑な実世界のデータセットで、教師なし画像セグメンテーションとオブジェクト中心のシーン生成の以前の方法よりも優れていることを示します。
Advances in object-centric generative models (OCGMs) have culminated in the development of a broad range of methods for unsupervised object segmentation and interpretable object-centric scene generation. These methods, however, are limited to simulated and real-world datasets with limited visual complexity. Moreover, object representations are often inferred using RNNs which do not scale well to large images or iterative refinement which avoids imposing an unnatural ordering on objects in an image but requires the a priori initialisation of a fixed number of object representations. In contrast to established paradigms, this work proposes an embedding-based approach in which embeddings of pixels are clustered in a differentiable fashion using a stochastic, non-parametric stick-breaking process. Similar to iterative refinement, this clustering procedure also leads to randomly ordered object representations, but without the need of initialising a fixed number of clusters a priori. This is used to develop a new model, GENESIS-V2, which can infer a variable number of object representations without using RNNs or iterative refinement. We show that GENESIS-V2 outperforms previous methods for unsupervised image segmentation and object-centric scene generation on established synthetic datasets as well as more complex real-world datasets.
updated: Wed Apr 21 2021 14:52:11 GMT+0000 (UTC)
published: Tue Apr 20 2021 14:59:27 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト