arXiv reaDer
Sketch-an-Anchor: ゼロショット スケッチベースの画像検索のためのサブエポック高速モデル適応
Sketch-an-Anchor: Sub-epoch Fast Model Adaptation for Zero-shot Sketch-based Image Retrieval
Sketch-an-Anchor は、エポックの下で最先端の Zero-shot Sketch-based Image Retrieval (ZSSBIR) モデルをトレーニングする新しい方法です。ほとんどの研究では、ZSSBIR の問題を 2 つの部分に分けています。SBIR から継承された画像とスケッチ間のドメイン アライメントと、ゼロショット プロトコルに固有の目に見えないデータへの一般化です。これらの問題の 1 つを大幅に単純化して、ZSSBIR 問題を既製モデルのゼロ ショット画像ベースの検索パフォーマンスに合わせて再構成できると主張します。私たちの高速収束モデルは、スケッチから同様の表現を抽出することを学習しながら、単一ドメインのパフォーマンスを維持します。この目的のために、セマンティック アンカー (単語ベースのセマンティック スペースと既製のモデルの機能から学習したガイド埋め込み) を導入し、それらを新しいアンカー コントラスティティブ ロスと組み合わせます。経験的証拠によると、他の方法よりも 100 分の 1 の反復回数でトレーニングしながら、すべてのベンチマーク データセットで最先端のパフォーマンスを達成できることが示されています。
Sketch-an-Anchor is a novel method to train state-of-the-art Zero-shot Sketch-based Image Retrieval (ZSSBIR) models in under an epoch. Most studies break down the problem of ZSSBIR into two parts: domain alignment between images and sketches, inherited from SBIR, and generalization to unseen data, inherent to the zero-shot protocol. We argue one of these problems can be considerably simplified and re-frame the ZSSBIR problem around the already-stellar yet underexplored Zero-shot Image-based Retrieval performance of off-the-shelf models. Our fast-converging model keeps the single-domain performance while learning to extract similar representations from sketches. To this end we introduce our Semantic Anchors -- guiding embeddings learned from word-based semantic spaces and features from off-the-shelf models -- and combine them with our novel Anchored Contrastive Loss. Empirical evidence shows we can achieve state-of-the-art performance on all benchmark datasets while training for 100x less iterations than other methods.
updated: Wed Mar 29 2023 15:00:02 GMT+0000 (UTC)
published: Wed Mar 29 2023 15:00:02 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト