Beyond Product Quantization: Deep Progressive Quantization for Image Retrieval
製品の量子化(PQ)は、非常に低いメモリ/時間コストで指数関数的に大きなコードブックを生成するための主流でした。その成功にもかかわらず、PQは高次元のベクトル空間の分解には依然として注意が必要であり、コード長が変更された場合、モデルの再トレーニングは通常避けられません。この作業では、大規模な画像検索のために、PQの代替としてディーププログレッシブ量子化(DPQ)モデルを提案します。 DPQは、量子化コードを順次学習し、元の特徴空間を段階的に近似します。したがって、異なるコード長の量子化コードを同時にトレーニングできます。具体的には、最初にラベル情報を利用して視覚的特徴の学習をガイドし、次にいくつかの量子化ブロックを適用して視覚的特徴に徐々にアプローチします。各量子化ブロックは畳み込みニューラルネットワークのレイヤーになるように設計されており、フレームワーク全体をエンドツーエンドでトレーニングできます。ベンチマークデータセットの実験結果は、私たちのモデルが画像検索の最先端を大幅に上回っていることを示しています。私たちのモデルは、さまざまなコード長に対して1回トレーニングされるため、計算時間が短縮されます。追加のアブレーション研究は、提案されたモデルの各コンポーネントの効果を示しています。私たちのコードはでリリースされています。
Product Quantization (PQ) has long been a mainstream for generating an exponentially large codebook at very low memory/time cost. Despite its success, PQ is still tricky for the decomposition of high-dimensional vector space, and the retraining of model is usually unavoidable when the code length changes. In this work, we propose a deep progressive quantization (DPQ) model, as an alternative to PQ, for large scale image retrieval. DPQ learns the quantization codes sequentially and approximates the original feature space progressively. Therefore, we can train the quantization codes with different code lengths simultaneously. Specifically, we first utilize the label information for guiding the learning of visual features, and then apply several quantization blocks to progressively approach the visual features. Each quantization block is designed to be a layer of a convolutional neural network, and the whole framework can be trained in an end-to-end manner. Experimental results on the benchmark datasets show that our model significantly outperforms the state-of-the-art for image retrieval. Our model is trained once for different code lengths and therefore requires less computation time. Additional ablation study demonstrates the effect of each component of our proposed model. Our code is released at
updated: Sat Dec 05 2020 03:22:03 GMT+0000 (UTC)
published: Sun Jun 16 2019 14:23:01 GMT+0000 (UTC)
