arXiv reaDer
MDFM:少数ショット学習のための多決定融合モデル
MDFM: Multi-Decision Fusing Model for Few-Shot Learning
近年、研究者は、データ不足の問題に対処するための数ショット学習(FSL)タスクにますます注目を集めています。標準のFSLフレームワークは、次の2つのコンポーネントで構成されています。i)事前トレーニング。基本データを使用して、CNNベースの特徴抽出モデル(FEM)を生成します。 ii)メタテスト。トレーニングされたFEMを新規データ(カテゴリはベースデータとは異なります)に適用して、機能の埋め込みを取得し、それらを認識します。研究者はFSLで目覚ましい進歩を遂げましたが、それでも根本的な問題が存在します。基本データを使用してトレーニングされたFEMは通常、新規クラスに完全に適応できないため、新規データの機能が分布シフトの問題につながる可能性があります。この課題に対処するために、さまざまなFEMに基づく決定のほとんどが弱い決定と見なされ、すべてのクラスで利用できるわけではない場合でも、特定のカテゴリで適切に実行されると仮定します。この仮定に触発されて、モデルの有効性と堅牢性を強化するために複数のFEMに基づく決定を包括的に考慮する新しい方法Multi-Decision Fusing Model(MDFM)を提案します。 MDFMは、既存のFEMに直接適用できる、シンプルで柔軟性のあるノンパラメトリック手法です。さらに、提案されたMDFMを2つのFSL設定(つまり、監視あり設定と半監視あり設定)に拡張します。提案された方法を5つのベンチマークデータセットで評価し、最新技術と比較して3.4%〜7.3%の大幅な改善を達成します。
In recent years, researchers pay growing attention to the few-shot learning (FSL) task to address the data-scarce problem. A standard FSL framework is composed of two components: i) Pre-train. Employ the base data to generate a CNN-based feature extraction model (FEM). ii) Meta-test. Apply the trained FEM to the novel data (category is different from base data) to acquire the feature embeddings and recognize them. Although researchers have made remarkable breakthroughs in FSL, there still exists a fundamental problem. Since the trained FEM with base data usually cannot adapt to the novel class flawlessly, the novel data's feature may lead to the distribution shift problem. To address this challenge, we hypothesize that even if most of the decisions based on different FEMs are viewed as weak decisions, which are not available for all classes, they still perform decently in some specific categories. Inspired by this assumption, we propose a novel method Multi-Decision Fusing Model (MDFM), which comprehensively considers the decisions based on multiple FEMs to enhance the efficacy and robustness of the model. MDFM is a simple, flexible, non-parametric method that can directly apply to the existing FEMs. Besides, we extend the proposed MDFM to two FSL settings (i.e., supervised and semi-supervised settings). We evaluate the proposed method on five benchmark datasets and achieve significant improvements of 3.4%-7.3% compared with state-of-the-arts.
updated: Fri Dec 03 2021 08:41:40 GMT+0000 (UTC)
published: Wed Dec 01 2021 18:13:09 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト