Revisiting Metric Learning for Few-Shot Image Classification
 少数ショット学習の目標は、各クラスのラベルされたサンプルをほんの少しだけ使用して、新しい視覚的概念を認識することです。最近の効果的なメトリックベースの少数ショットアプローチは、ニューラルネットワークを使用して、クエリとサポートの例の機能の類似性比較を学習します。ただし、特徴の埋め込み、つまりトレーニングサンプル間の関係を調査することの重要性は無視されます。この作業では、特徴の埋め込みの重要性を強調することにより、少数ショット分類のシンプルかつ強力なベースラインを示します。具体的には、ディープメトリック学習からの古典的なトリプレットネットワークを再訪し、入力サンプル間の関係を利用してエピソードトレーニングを介して一般的な表現学習を学習する、少数ショット学習のディープK-tupletネットワークに拡張します。トレーニングが完了すると、私たちのネットワークは目に見えない新しいカテゴリの特徴的な特徴を抽出し、非線形距離メトリック関数とシームレスに統合して、少数ショットの分類を容易にすることができます。 miniImageNetベンチマークでの結果は、他のメトリックベースの少数ショット分類法よりも優れています。さらに重要なことに、miniImageNetでトレーニングされたモデルを使用して完全に異なるデータセット(Caltech-101、CUB-200、Stanford Dogs and Cars)で評価すると、このメソッドは以前のメソッドを大幅に上回り、目に見えないクラスに一般化する優れた機能を示しています。
The goal of few-shot learning is to recognize new visual concepts with just a few amount of labeled samples in each class. Recent effective metric-based few-shot approaches employ neural networks to learn a feature similarity comparison between query and support examples. However, the importance of feature embedding, i.e., exploring the relationship among training samples, is neglected. In this work, we present a simple yet powerful baseline for few-shot classification by emphasizing the importance of feature embedding. Specifically, we revisit the classical triplet network from deep metric learning, and extend it into a deep K-tuplet network for few-shot learning, utilizing the relationship among the input samples to learn a general representation learning via episode-training. Once trained, our network is able to extract discriminative features for unseen novel categories and can be seamlessly incorporated with a non-linear distance metric function to facilitate the few-shot classification. Our result on the miniImageNet benchmark outperforms other metric-based few-shot classification methods. More importantly, when evaluated on completely different datasets (Caltech-101, CUB-200, Stanford Dogs and Cars) using the model trained with miniImageNet, our method significantly outperforms prior methods, demonstrating its superior capability to generalize to unseen classes.
updated: Thu Apr 16 2020 04:24:48 GMT+0000 (UTC)
published: Sat Jul 06 2019 12:19:01 GMT+0000 (UTC)
