arXiv reaDer
FSL のプリミティブ認識識別表現の学習
Learning Primitive-aware Discriminative Representations for FSL
少数ショット学習 (FSL) は、クラスごとにラベル付けされた例がわずかしかない場合に、新しいクラスを認識するように簡単に適応できる分類器を学習することを目的としています.データが限られているため、深層学習ではこのタスクが困難になります.最近のメトリックベースの方法は有望なパフォーマンスを達成しています.画像レベルの特徴に基づいています.しかし、これらのグローバルな特徴は、見えるクラスと見えないクラスの間で転送可能で一貫性のある豊富なローカルおよび構造情報を無視します.認知科学のいくつかの研究では、人間は学習したプリミティブで新しいクラスを認識できると主張しています.基本クラスからの転送可能な表現と識別可能な表現の両方を採用し、それらを採用して新しいクラスを認識します。ベースの FSL モデル。最初に自己監視補助タスクを追加し、特徴抽出器にプリミティブに対応する tvisual パターンを強制的に学習させます。転送可能なプリミティブ認識表現をさらにマイニングして生成するために、無用なものを抑制しながら有益なチャネルマップを強化することにより、オブジェクト埋め込みからビジュアルプリミティブのセットを合成する適応チャネルグループ化 (ACG) モジュールを設計します。学習したプリミティブ機能に基づいて,セマンティック相関推論(SCR)モジュールを提案し,それらの間の内部関係を捉える.最後に,プリミティブのタスク固有の重要性を学習し,タスク固有の注意機能に基づいてプリミティブレベルのメトリックを実行する.広範な実験により、私たちの方法が6つの標準ベンチマークで最先端の結果を達成することが示されています。
Few-shot learning (FSL) aims to learn a classifier that can be easily adapted to recognize novel classes,given only a few labeled examples per class.Limited data keep this task challenging for deep learning.Recent metric-based methods has achieved promising performance based on image-level features.However,these global features ignore abundant local and structural information that is transferable and consistent between seen and unseen classes.Some study in cognitive science argue that humans can recognize novel classes with the learned primitives.We expect to mine both transferable and discriminative representation from base classes and adopt them to recognize novel classes.Building on the episodic training mechanism,We propose a Primitive Mining and Reasoning Network(PMRN) to learn primitive-aware representation in an end-to-end manner for metric-based FSL model.We first add self-supervision auxiliary task,forcing feature extractor to learn tvisual pattern corresponding to primitives.To further mine and produce transferable primitive-aware representations,we design an Adaptive Channel Grouping(ACG)module to synthesize a set of visual primitives from object embedding by enhancing informative channel maps while suppressing useless ones. Based on the learned primitive feature,a Semantic Correlation Reasoning (SCR) module is proposed to capture internal relations among them.Finally,we learn the task-specific importance of primitives and conduct primitive-level metric based on the task-specific attention feature.Extensive experiments show that our method achieves state-of-the-art results on six standard benchmarks.
updated: Sat Aug 20 2022 16:22:22 GMT+0000 (UTC)
published: Sat Aug 20 2022 16:22:22 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト