arXiv reaDer
クラスタリングベースのスロット初期化による解釈可能なオブジェクトの抽象化の強化
Enhancing Interpretable Object Abstraction via Clustering-based Slot Initialization
スロットを使用したオブジェクト中心の表現は、構成シーンにおける低レベルの知覚特徴から効率的で柔軟かつ解釈可能な抽象化に向けた進歩を示しています。現在のアプローチでは、スロットの初期状態をランダム化し、その後、反復的な改良を行っています。この論文で示すように、ランダムなスロットの初期化は、最終的なスロット予測の精度に大きく影響します。さらに、現在のアプローチでは、データの事前知識に基づいて所定の数のスロットが必要となるため、現実世界への適用性が制限されます。私たちの作業では、知覚入力特徴を条件としたクラスタリング アルゴリズムを使用してスロット表現を初期化します。これには、識別されたクラスターを考慮してスロットを初期化するために、アーキテクチャーに追加のレイヤーが必要です。クラスタリング後に交換可能なスロット表現を可能にするために、この層の順列不変バージョンと順列等変バージョンを設計します。さらに、平均シフト クラスタリングを採用して、特定のシーンのスロット数を自動的に識別します。さまざまなデータセットを使用して、オブジェクトの発見と新しいビューの合成タスクに関する手法を評価します。結果は、特に複雑なシーンにおいて、私たちの方法が以前の研究よりも一貫して優れていることを示しています。
Object-centric representations using slots have shown the advances towards efficient, flexible and interpretable abstraction from low-level perceptual features in a compositional scene. Current approaches randomize the initial state of slots followed by an iterative refinement. As we show in this paper, the random slot initialization significantly affects the accuracy of the final slot prediction. Moreover, current approaches require a predetermined number of slots from prior knowledge of the data, which limits the applicability in the real world. In our work, we initialize the slot representations with clustering algorithms conditioned on the perceptual input features. This requires an additional layer in the architecture to initialize the slots given the identified clusters. We design permutation invariant and permutation equivariant versions of this layer to enable the exchangeable slot representations after clustering. Additionally, we employ mean-shift clustering to automatically identify the number of slots for a given scene. We evaluate our method on object discovery and novel view synthesis tasks with various datasets. The results show that our method outperforms prior works consistently, especially for complex scenes.
updated: Tue Aug 22 2023 11:48:43 GMT+0000 (UTC)
published: Tue Aug 22 2023 11:48:43 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト