arXiv reaDer
アダプティブファイングレインスケッチベースの画像検索
Adaptive Fine-Grained Sketch-Based Image Retrieval
ファイングレインスケッチベースの画像検索(FG-SBIR)に対する最近の焦点は、モデルからのトレーニングデータなしで、モデルを新しいカテゴリに一般化する方向にシフトしています。ただし、実際のアプリケーションでは、トレーニングされたFG-SBIRモデルが、新しいカテゴリとさまざまな人間のスケッチャー、つまりさまざまな描画スタイルの両方に適用されることがよくあります。これは一般化の問題を複雑にしますが、幸いなことに、いくつかの例が通常利用可能であり、モデルを新しいカテゴリ/スタイルに適応させることができます。このホワイトペーパーでは、新しい視点を提供します。一般化するモデルを求める代わりに、テスト中のサンプルが非常に少ない(数ショットの方法で)迅速に適応するモデルを提唱します。この新しい問題を解決するために、いくつかの重要な変更を加えた新しいモデルにとらわれないメタ学習(MAML)ベースのフレームワークを導入します。(1)マージンベースの対照損失を伴う検索タスクとして、内部ループでのMAMLトレーニングを簡素化します。それをより安定して扱いやすくするために。 (2)対照的な損失のマージンも、モデルの他の部分でメタ学習されます。 (3)メタ学習されたFG-SBIRモデルをカテゴリ/スタイルの適応により効果的にするために、3つの追加の正則化損失が外側のループに導入されます。公開データセットでの広範な実験は、一般化とゼロショットベースのアプローチ、およびいくつかの強力な数ショットのベースラインよりも大幅に向上していることを示唆しています。
The recent focus on Fine-Grained Sketch-Based Image Retrieval (FG-SBIR) has shifted towards generalising a model to new categories without any training data from them. In real-world applications, however, a trained FG-SBIR model is often applied to both new categories and different human sketchers, i.e., different drawing styles. Although this complicates the generalisation problem, fortunately, a handful of examples are typically available, enabling the model to adapt to the new category/style. In this paper, we offer a novel perspective -- instead of asking for a model that generalises, we advocate for one that quickly adapts, with just very few samples during testing (in a few-shot manner). To solve this new problem, we introduce a novel model-agnostic meta-learning (MAML) based framework with several key modifications: (1) As a retrieval task with a margin-based contrastive loss, we simplify the MAML training in the inner loop to make it more stable and tractable. (2) The margin in our contrastive loss is also meta-learned with the rest of the model. (3) Three additional regularisation losses are introduced in the outer loop, to make the meta-learned FG-SBIR model more effective for category/style adaptation. Extensive experiments on public datasets suggest a large gain over generalisation and zero-shot based approaches, and a few strong few-shot baselines.
updated: Mon Jul 04 2022 21:07:20 GMT+0000 (UTC)
published: Mon Jul 04 2022 21:07:20 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト