arXiv reaDer
少数ショット分類を改善するためのローカル記述子の再検討
Revisiting Local Descriptor for Improved Few-Shot Classification
少数のショットの分類は、少数のサポート画像に基づいて新しいクラスを理解するために深い学習者を迅速に適応させる問題を研究します。これに関連して、最近の研究努力は、クエリ画像とサポート画像の間の類似性を測定するますます複雑な分類器を設計することを目的としていますが、特徴の埋め込みの重要性はほとんど探求されていません。高度な分類器に依存する必要はなく、改善された機能の埋め込みに直接適用される単純な分類器は、代わりに文献の主要な方法のほとんどを上回ることができることを示します。この目的のために、数ショット分類のためのDCAPという名前の新しい方法を提示します。この方法では、高密度分類と注意深いプーリングを活用して、埋め込みの品質を向上させる方法を調査します。具体的には、最初に密な分類問題を解決するためにサンプルが豊富な基本クラスで学習者をトレーニングし、次にランダムにサンプリングされた一連の数ショットタスクで学習者をメタトレーニングして、少数ショットシナリオまたはテスト時間シナリオに適応させることを提案します。 。メタトレーニング中に、広く使用されているグローバル平均プーリング(GAP)の代わりに注意深いプーリングを適用して特徴マップをプールし、数ショット分類用の埋め込みを準備することをお勧めします。注意深いプーリングは、ローカル記述子を再重み付けすることを学習し、学習者が意思決定の証拠として何を探しているかを説明します。 2つのベンチマークデータセットでの実験は、提案された方法が複数の数ショットの設定で優れている一方で、より単純でより説明しやすいことを示しています。コードはhttps://github.com/Ukeyboard/dcap/で入手できます。
Few-shot classification studies the problem of quickly adapting a deep learner to understanding novel classes based on few support images. In this context, recent research efforts have been aimed at designing more and more complex classifiers that measure similarities between query and support images, but left the importance of feature embeddings seldom explored. We show that the reliance on sophisticated classifiers is not necessary, and a simple classifier applied directly to improved feature embeddings can instead outperform most of the leading methods in the literature. To this end, we present a new method named DCAP for few-shot classification, in which we investigate how one can improve the quality of embeddings by leveraging Dense Classification and Attentive Pooling. Specifically, we propose to train a learner on base classes with abundant samples to solve dense classification problem first and then meta-train the learner on a bunch of randomly sampled few-shot tasks to adapt it to few-shot scenario or the test time scenario. During meta-training, we suggest to pool feature maps by applying attentive pooling instead of the widely used global average pooling (GAP) to prepare embeddings for few-shot classification. Attentive pooling learns to reweight local descriptors, explaining what the learner is looking for as evidence for decision making. Experiments on two benchmark datasets show the proposed method to be superior in multiple few-shot settings while being simpler and more explainable. Code is available at: https://github.com/Ukeyboard/dcap/.
updated: Fri Feb 18 2022 10:57:26 GMT+0000 (UTC)
published: Tue Mar 30 2021 00:48:28 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト