arXiv reaDer
GMAIR: 空間的注意とガウス混合に基づく教師なしオブジェクト検出
GMAIR: Unsupervised Object Detection Based on Spatial Attention and Gaussian Mixture
空間的注意に基づく教師なしオブジェクト検出に関する最近の研究は、有望な結果を達成しています。 AIR や SPAIR などのモデルは、シーン内のオブジェクトの属性と位置をそれぞれ表す "what" および "where" 潜在変数を出力します。以前の研究のほとんどは、「どこで」ローカリゼーションのパフォーマンスに焦点を当てています。ただし、「何」オブジェクトの属性を取得することも、表現学習に不可欠であると主張しています。このペーパーでは、教師なしオブジェクト検出のためのフレームワーク GMAIR を紹介します。これは、統合された深層生成モデルに空間的注意とガウス混合を組み込んでいます。 GMAIR は、シーン内のオブジェクトを特定し、監督なしでそれらを同時にクラスター化できます。さらに、「何」の潜在変数とクラスタリング プロセスを分析します。最後に、MultiMNIST および Fruit2D データセットでモデルを評価し、GMAIR が最先端の方法と比較してローカリゼーションとクラスタリングで競争力のある結果を達成することを示します。
Recent studies on unsupervised object detection based on spatial attention have achieved promising results. Models, such as AIR and SPAIR, output "what" and "where" latent variables that represent the attributes and locations of objects in a scene, respectively. Most of the previous studies concentrate on the "where" localization performance; however, we claim that acquiring "what" object attributes is also essential for representation learning. This paper presents a framework, GMAIR, for unsupervised object detection. It incorporates spatial attention and a Gaussian mixture in a unified deep generative model. GMAIR can locate objects in a scene and simultaneously cluster them without supervision. Furthermore, we analyze the "what" latent variables and clustering process. Finally, we evaluate our model on MultiMNIST and Fruit2D datasets and show that GMAIR achieves competitive results on localization and clustering compared to state-of-the-art methods.
updated: Thu Jun 03 2021 09:50:13 GMT+0000 (UTC)
published: Thu Jun 03 2021 09:50:13 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト