arXiv reaDer
ACNet:ゼロショットスケッチベースの画像検索のためのアプローチおよび集中化ネットワーク
ACNet: Approaching-and-Centralizing Network for Zero-Shot Sketch-Based Image Retrieval
スケッチと写真の間の大きなドメインギャップと非常に抽象的なスケッチ表現は、スケッチベースの画像検索(SBIR)に課題をもたらします。ゼロショットスケッチベースの画像検索(ZS-SBIR)は、より一般的で実用的ですが、表示されているカテゴリと表示されていないカテゴリの間に追加の知識ギャップがあるため、さらに大きな課題があります。両方のギャップを同時に緩和するために、スケッチから写真への合成と画像検索を共同で最適化するアプローチおよび集中化ネットワーク(「ACNet」と呼ばれる)を提案します。検索モジュールは、合成モジュールをガイドして、写真ドメインに徐々に近づく多様な写真のような画像を大量に生成します。したがって、ドメインにとらわれない表現と、目に見えないカテゴリに一般化するためのカテゴリにとらわれない一般的な知識を学習するために、これまで以上に検索モジュールに役立ちます。 。検索ガイダンスで生成されたこれらの多様な画像は、高勾配の具体的なカテゴリ固有のトレーニングサンプルを悩ます過剰適合の問題を効果的に軽減できます。また、プロキシベースのNormSoftmax損失の使用は、ゼロショット設定で効果的であることがわかります。これは、その集中化効果により、共同トレーニングが安定し、見えないカテゴリへの一般化能力が促進されるためです。私たちのアプローチはシンプルでありながら効果的であり、広く使用されている2つのZS-SBIRデータセットで最先端のパフォーマンスを実現し、以前の方法を大幅に上回っています。
The huge domain gap between sketches and photos and the highly abstract sketch representations pose challenges for sketch-based image retrieval (SBIR). The zero-shot sketch-based image retrieval (ZS-SBIR) is more generic and practical but poses an even greater challenge because of the additional knowledge gap between the seen and unseen categories. To simultaneously mitigate both gaps, we propose an Approaching-and-Centralizing Network (termed ``ACNet'') to jointly optimize sketch-to-photo synthesis and the image retrieval. The retrieval module guides the synthesis module to generate large amounts of diverse photo-like images which gradually approach the photo domain, and thus better serve the retrieval module than ever to learn domain-agnostic representations and category-agnostic common knowledge for generalizing to unseen categories. These diverse images generated with retrieval guidance can effectively alleviate the overfitting problem troubling concrete category-specific training samples with high gradients. We also discover the use of proxy-based NormSoftmax loss is effective in the zero-shot setting because its centralizing effect can stabilize our joint training and promote the generalization ability to unseen categories. Our approach is simple yet effective, which achieves state-of-the-art performance on two widely used ZS-SBIR datasets and surpasses previous methods by a large margin.
updated: Wed Nov 24 2021 19:36:10 GMT+0000 (UTC)
published: Wed Nov 24 2021 19:36:10 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト