arXiv reaDer
潜在的セマンティックコンポーネントを使用した教師なしディープハッシュ
Deep Unsupervised Hashing with Latent Semantic Components
画像検索のレジームでは、教師なしの深いハッシュが高く評価されています。しかしながら、ほとんどの先行技術は、画像の背後にある意味論的構成要素およびそれらの関係を検出することができず、それにより、それらは識別力を欠いている。欠陥を補うために、我々は新しいディープセマンティックコンポーネントハッシュ(DSCH)を提案します。これは、画像には通常、相同性と共起関係を持つセマンティックコンポーネントの束が含まれているという常識が含まれます。この事前情報に基づいて、DSCHは、期待値最大化フレームワークの下でセマンティックコンポーネントを潜在変数と見なし、トレーニングデータの最尤法を目的とした2段階の反復アルゴリズムを設計します。まず、DSCHは、画像が複数のコンポーネントの混合として表され、セマンティクスの共起が利用されるGaussian Mixture Modal〜(GMM)を使用して、画像のきめ細かいセマンティクスコンポーネントを明らかにすることにより、セマンティックコンポーネント構造を構築します。また、きめの細かいセマンティクスコンポーネントは、きめの細かいコンポーネント間の相同関係を考慮して発見され、階層構成が構築されます。次に、DSCHは、画像を細粒度レベルと粗粒度レベルの両方でセマンティックコンポーネントの中心に近づけ、画像が互いに近い類似のセマンティックコンポーネントを共有するようにします。 3つのベンチマークデータセットでの広範な実験は、提案された階層的セマンティックコンポーネントが実際にハッシュモデルを容易にして優れたパフォーマンスを達成することを示しています。
Deep unsupervised hashing has been appreciated in the regime of image retrieval. However, most prior arts failed to detect the semantic components and their relationships behind the images, which makes them lack discriminative power. To make up the defect, we propose a novel Deep Semantic Components Hashing (DSCH), which involves a common sense that an image normally contains a bunch of semantic components with homology and co-occurrence relationships. Based on this prior, DSCH regards the semantic components as latent variables under the Expectation-Maximization framework and designs a two-step iterative algorithm with the objective of maximum likelihood of training data. Firstly, DSCH constructs a semantic component structure by uncovering the fine-grained semantics components of images with a Gaussian Mixture Modal~(GMM), where an image is represented as a mixture of multiple components, and the semantics co-occurrence are exploited. Besides, coarse-grained semantics components, are discovered by considering the homology relationships between fine-grained components, and the hierarchy organization is then constructed. Secondly, DSCH makes the images close to their semantic component centers at both fine-grained and coarse-grained levels, and also makes the images share similar semantic components close to each other. Extensive experiments on three benchmark datasets demonstrate that the proposed hierarchical semantic components indeed facilitate the hashing model to achieve superior performance.
updated: Thu Mar 17 2022 16:18:01 GMT+0000 (UTC)
published: Thu Mar 17 2022 16:18:01 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト