arXiv reaDer
ディープスペクトル法:教師なしセマンティックセグメンテーションとローカリゼーションの驚くほど強力なベースライン
Deep Spectral Methods: A Surprisingly Strong Baseline for Unsupervised Semantic Segmentation and Localization
教師なしローカリゼーションとセグメンテーションは、ラベル付けされたデータなしで画像を意味的に意味のあるセグメントに分解することを含む、長年のコンピュータビジョンの課題です。これらのタスクは、密な画像注釈を取得するのが困難でコストがかかるため、教師なし設定では特に興味深いものですが、既存の教師なしアプローチは、複数のオブジェクトを含む複雑なシーンで苦労します。純粋に深層学習に基づく既存の方法とは異なり、画像分解をグラフ分割問題として再構成することにより、従来のスペクトルセグメンテーション方法からインスピレーションを得ています。具体的には、自己監視ネットワークからの特徴親和性行列のラプラシアンの固有ベクトルを調べます。これらの固有ベクトルはすでに画像を意味のあるセグメントに分解しており、シーン内のオブジェクトをローカライズするために簡単に使用できることがわかります。さらに、データセット全体でこれらのセグメントに関連付けられた機能をクラスタリングすることにより、明確に描写された名前の付け可能な領域、つまりセマンティックセグメンテーションを取得できます。複雑なデータセット(Pascal VOC、MS-COCO)での実験は、私たちの単純なスペクトル法が、教師なしローカリゼーションとセグメンテーションにおいて最先端のものを大幅に上回っていることを示しています。さらに、私たちの方法は、背景の除去や合成など、さまざまな複雑な画像編集タスクに簡単に使用できます。
Unsupervised localization and segmentation are long-standing computer vision challenges that involve decomposing an image into semantically-meaningful segments without any labeled data. These tasks are particularly interesting in an unsupervised setting due to the difficulty and cost of obtaining dense image annotations, but existing unsupervised approaches struggle with complex scenes containing multiple objects. Differently from existing methods, which are purely based on deep learning, we take inspiration from traditional spectral segmentation methods by reframing image decomposition as a graph partitioning problem. Specifically, we examine the eigenvectors of the Laplacian of a feature affinity matrix from self-supervised networks. We find that these eigenvectors already decompose an image into meaningful segments, and can be readily used to localize objects in a scene. Furthermore, by clustering the features associated with these segments across a dataset, we can obtain well-delineated, nameable regions, i.e. semantic segmentations. Experiments on complex datasets (Pascal VOC, MS-COCO) demonstrate that our simple spectral method outperforms the state-of-the-art in unsupervised localization and segmentation by a significant margin. Furthermore, our method can be readily used for a variety of complex image editing tasks, such as background removal and compositing.
updated: Mon May 16 2022 17:47:44 GMT+0000 (UTC)
published: Mon May 16 2022 17:47:44 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト