arXiv reaDer
画像検索のための階層を使用した視覚的類似性と意味的類似性の統合
Integrating Visual and Semantic Similarity Using Hierarchies for Image Retrieval
コンテンツベースの画像検索 (CBIR) の研究のほとんどは、クエリに視覚的に類似した画像のデータベースからインスタンスを効果的に取得できる堅牢な特徴表現の開発に焦点を当てています。ただし、取得された画像には、意味的にクエリに関連しない結果が含まれる場合があります。これに対処するために、視覚的階層を使用して視覚的および意味的類似性の両方を捕捉する CBIR の方法を提案します。階層は、重複するクラスが高い視覚的および意味論的な類似性を共有すると仮定して、分類用にトレーニングされたディープ ニューラル ネットワークの潜在空間内の重複する特徴を持つクラスをマージすることによって構築されます。最後に、構築された階層は、類似性検索のための距離計算メトリックに統合されます。標準データセット: CUB-200-2011 および CIFAR100 での実験、および珪藻顕微鏡画像を使用した実際の使用例は、画像検索において、私たちの方法が既存の方法と比較して優れたパフォーマンスを達成することを示しています。
Most of the research in content-based image retrieval (CBIR) focus on developing robust feature representations that can effectively retrieve instances from a database of images that are visually similar to a query. However, the retrieved images sometimes contain results that are not semantically related to the query. To address this, we propose a method for CBIR that captures both visual and semantic similarity using a visual hierarchy. The hierarchy is constructed by merging classes with overlapping features in the latent space of a deep neural network trained for classification, assuming that overlapping classes share high visual and semantic similarities. Finally, the constructed hierarchy is integrated into the distance calculation metric for similarity search. Experiments on standard datasets: CUB-200-2011 and CIFAR100, and a real-life use case using diatom microscopy images show that our method achieves superior performance compared to the existing methods on image retrieval.
updated: Wed Aug 16 2023 15:23:14 GMT+0000 (UTC)
published: Wed Aug 16 2023 15:23:14 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト