arXiv reaDer
少数のショット学習のための原始的な知識を備えたプロトタイプの完成
Prototype Completion with Primitive Knowledge for Few-Shot Learning
数ショットの学習は、いくつかの例で新しいクラスの分類子を学習することを目的とした挑戦的なタスクです。事前トレーニングベースのメタ学習方法は、特徴抽出器を事前トレーニングし、最も近い重心ベースのメタ学習を通じてそれを微調整することにより、問題に効果的に取り組みます。ただし、結果は、微調整ステップによってごくわずかな改善が行われることを示しています。この論文では、1)主な理由を理解します。つまり、事前にトレーニングされた特徴空間では、基本クラスはすでにコンパクトなクラスターを形成していますが、新しいクラスは大きな分散を持つグループとして広がっています。これは、特徴抽出器の微調整があまり意味がありません。 2)特徴抽出器を微調整する代わりに、メタ学習中に、より代表的なプロトタイプを推定することに焦点を当てます。したがって、我々は新しいプロトタイプ完成ベースのメタ学習フレームワークを提案します。このフレームワークは、最初に原始的な知識(つまり、クラスレベルの部分または属性の注釈)を導入し、代表的な属性の特徴を事前に抽出します。次に、これらの事前設定を使用してプロトタイプを完成させる方法を学習するために、プロトタイプ完成ネットワークを設計します。原始的な知識ノイズまたはクラスの違いによって引き起こされるプロトタイプ完了エラーを回避するために、ラベルのないサンプルを活用することにより、平均ベースのプロトタイプと完了したプロトタイプを組み合わせたガウスベースのプロトタイプ融合戦略をさらに開発します。広範な実験により、私たちの方法は次のことが示されています。(i)より正確なプロトタイプを取得できる。 (ii)分類精度の点で、最先端の技術を2%〜9%上回っています。私たちのコードはオンラインで入手できます。
Few-shot learning is a challenging task, which aims to learn a classifier for novel classes with few examples. Pre-training based meta-learning methods effectively tackle the problem by pre-training a feature extractor and then fine-tuning it through the nearest centroid based meta-learning. However, results show that the fine-tuning step makes very marginal improvements. In this paper, 1) we figure out the key reason, i.e., in the pre-trained feature space, the base classes already form compact clusters while novel classes spread as groups with large variances, which implies that fine-tuning the feature extractor is less meaningful; 2) instead of fine-tuning the feature extractor, we focus on estimating more representative prototypes during meta-learning. Consequently, we propose a novel prototype completion based meta-learning framework. This framework first introduces primitive knowledge (i.e., class-level part or attribute annotations) and extracts representative attribute features as priors. Then, we design a prototype completion network to learn to complete prototypes with these priors. To avoid the prototype completion error caused by primitive knowledge noises or class differences, we further develop a Gaussian based prototype fusion strategy that combines the mean-based and completed prototypes by exploiting the unlabeled samples. Extensive experiments show that our method: (i) can obtain more accurate prototypes; (ii) outperforms state-of-the-art techniques by 2% - 9% in terms of classification accuracy. Our code is available online.
updated: Sun May 09 2021 01:32:12 GMT+0000 (UTC)
published: Thu Sep 10 2020 16:09:34 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト