arXiv reaDer
STIR: 画像検索後処理用のシャム変換
STIR: Siamese Transformer for Image Retrieval Postprocessing
画像検索のための現在のメトリック学習アプローチは、通常、コサイン距離などの単純なアプローチがうまく機能する有益な潜在表現の空間を学習することに基づいています。 HypViT などの最近の最先端の手法は、より複雑な埋め込みスペースに移行しており、より良い結果が得られる可能性がありますが、運用環境へのスケーリングが困難になっています。この作業では、最初に、最先端レベルで実行され、これらの欠点を持たないハード ネガティブ マイニングを使用して、トリプレット ロスに基づくより単純なモデルを構築します。次に、1 回のフォワード パスで複数の上位出力を再ランク付けする、画像検索用シャム変換 (STIR) と呼ばれる画像検索後処理の新しいアプローチを紹介します。以前に提案された Reranking Transformers とは異なり、STIR はグローバル/ローカルの特徴抽出に依存せず、アテンション メカニズムを使用してクエリ画像と取得された候補をピクセル レベルで直接比較します。結果として得られるアプローチは、標準的な画像検索データセットに関する新しい最先端技術を定義します: Stanford Online Products と DeepFashion In-shop。また、https://github.com/OML-Team/open-metric-learning/tree/main/pipelines/postprocessing/ でソース コードをリリースし、https://dapladoc-oml-postprocessing でアプローチのインタラクティブなデモをリリースします。 -demo-srcappmain-pfh2g0.streamlit.app/
Current metric learning approaches for image retrieval are usually based on learning a space of informative latent representations where simple approaches such as the cosine distance will work well. Recent state of the art methods such as HypViT move to more complex embedding spaces that may yield better results but are harder to scale to production environments. In this work, we first construct a simpler model based on triplet loss with hard negatives mining that performs at the state of the art level but does not have these drawbacks. Second, we introduce a novel approach for image retrieval postprocessing called Siamese Transformer for Image Retrieval (STIR) that reranks several top outputs in a single forward pass. Unlike previously proposed Reranking Transformers, STIR does not rely on global/local feature extraction and directly compares a query image and a retrieved candidate on pixel level with the usage of attention mechanism. The resulting approach defines a new state of the art on standard image retrieval datasets: Stanford Online Products and DeepFashion In-shop. We also release the source code at https://github.com/OML-Team/open-metric-learning/tree/main/pipelines/postprocessing/ and an interactive demo of our approach at https://dapladoc-oml-postprocessing-demo-srcappmain-pfh2g0.streamlit.app/
updated: Thu Apr 27 2023 05:35:46 GMT+0000 (UTC)
published: Wed Apr 26 2023 09:10:15 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト