arXiv reaDer
位相相関ネットワークによる教師なし画像分解
Unsupervised Image Decomposition with Phase-Correlation Networks
シーンをオブジェクトコンポーネントに分解する機能は、自律エージェントにとって望ましいプロパティであり、周囲で推論して行動することができます。最近、教師なしの方法でデータからオブジェクト中心の表現を学習するためのさまざまな方法が提案されています。これらの方法は、多くの場合、ディープニューラルネットワークによって学習された潜在表現に依存しているため、高い計算コストと大量のキュレートされたデータが必要になります。このようなモデルも解釈が困難です。これらの課題に対処するために、フェーズ相関分解ネットワーク(PCDNet)を提案します。これは、シーンをオブジェクトコンポーネントに分解する新しいモデルであり、学習したオブジェクトプロトタイプのセットの変換バージョンとして表されます。 PCDNetのコアビルディングブロックは、位相相関セル(PCセル)です。これは、画像の周波数領域表現を利用して、オブジェクトのプロトタイプと画像内の変換されたバージョンとの間の変換を推定します。私たちの実験では、PCDNetが、少数の学習可能なパラメーターを使用し、完全に解釈可能でありながら、単純なベンチマークデータセットおよびより困難なデータでの教師なしオブジェクトの発見とセグメンテーションの最先端の方法よりも優れていることを示します。
The ability to decompose scenes into their object components is a desired property for autonomous agents, allowing them to reason and act in their surroundings. Recently, different methods have been proposed to learn object-centric representations from data in an unsupervised manner. These methods often rely on latent representations learned by deep neural networks, hence requiring high computational costs and large amounts of curated data. Such models are also difficult to interpret. To address these challenges, we propose the Phase-Correlation Decomposition Network (PCDNet), a novel model that decomposes a scene into its object components, which are represented as transformed versions of a set of learned object prototypes. The core building block in PCDNet is the Phase-Correlation Cell (PC Cell), which exploits the frequency-domain representation of the images in order to estimate the transformation between an object prototype and its transformed version in the image. In our experiments, we show how PCDNet outperforms state-of-the-art methods for unsupervised object discovery and segmentation on simple benchmark datasets and on more challenging data, while using a small number of learnable parameters and being fully interpretable.
updated: Mon Jan 10 2022 10:23:55 GMT+0000 (UTC)
published: Thu Oct 07 2021 13:57:33 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト