arXiv reaDer
効率的な細粒度画像検索のためのピラミッドハイブリッドプーリング量子化
Pyramid Hybrid Pooling Quantization for Efficient Fine-Grained Image Retrieval
ディープ量子化やディープバイナリハッシュを含むディープハッシュアプローチは、高い計算効率とストレージ効率により、大規模な画像検索の一般的なソリューションになっています。ほとんどの既存のハッシュ方法は、通常、最後のCNN層の出力を採用してバイナリコードを生成するため、きめ細かい検索で満足のいく結果を生成できません。これは、微妙ではあるが識別可能な視覚的な詳細をキャプチャするのに効果的ではありません。きめ細かい画像ハッシュを改善するために、ピラミッドハイブリッドプーリング量子化(PHPQ)を提案します。具体的には、ピラミッドハイブリッドプーリング(PHP)モジュールを提案して、マルチレベル機能からきめ細かいセマンティック情報をキャプチャして保存します。さらに、部分的注意メカニズムを備えた学習可能な量子化モジュールを提案します。これは、最も関連性の高いコードワードを最適化し、量子化を改善するのに役立ちます。包括的な実験は、PHPQが最先端の方法よりも優れていることを示しています。
Deep hashing approaches, including deep quantization and deep binary hashing, have become a common solution to large-scale image retrieval due to high computation and storage efficiency. Most existing hashing methods can not produce satisfactory results for fine-grained retrieval, because they usually adopt the outputs of the last CNN layer to generate binary codes, which is less effective to capture subtle but discriminative visual details. To improve fine-grained image hashing, we propose Pyramid Hybrid Pooling Quantization (PHPQ). Specifically, we propose a Pyramid Hybrid Pooling (PHP) module to capture and preserve fine-grained semantic information from multi-level features. Besides, we propose a learnable quantization module with a partial attention mechanism, which helps to optimize the most relevant codewords and improves the quantization. Comprehensive experiments demonstrate that PHPQ outperforms state-of-the-art methods.
updated: Sat Sep 11 2021 07:21:02 GMT+0000 (UTC)
published: Sat Sep 11 2021 07:21:02 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト