arXiv reaDer
少数のショット学習のためのプロトタイプの完成
Prototype Completion for Few-Shot Learning
少数のショットの学習は、いくつかの例で新しいクラスを認識することを目的としています。事前トレーニングベースの方法は、特徴抽出器を事前トレーニングし、次に最も近い重心ベースのメタ学習を通じてそれを微調整することにより、問題に効果的に取り組みます。ただし、結果は、微調整ステップによってわずかな改善が見られることを示しています。この論文では、1)理由を理解します。つまり、事前にトレーニングされた特徴空間では、基本クラスはすでにコンパクトなクラスターを形成していますが、新しいクラスは分散の大きいグループとして広がっています。これは、特徴抽出器の微調整はあまり意味がないことを意味します。 ; 2)特徴抽出器を微調整する代わりに、より代表的なプロトタイプの推定に焦点を当てます。したがって、我々は新しいプロトタイプ完成ベースのメタ学習フレームワークを提案します。このフレームワークは、最初に原始的な知識(つまり、クラスレベルのパーツまたは属性の注釈)を導入し、事前に表示された属性の代表的な機能を抽出します。第二に、部品/属性転送ネットワークは、補足的な事前情報として、見えない属性の代表的な機能を推測することを学習するように設計されています。最後に、これらの事前設定を使用してプロトタイプを完成させる方法を学習するために、プロトタイプ完成ネットワークが考案されています。さらに、プロトタイプの完了エラーを回避するために、ラベルのないサンプルを利用して、平均ベースのプロトタイプと完成したプロトタイプを融合するガウスベースのプロトタイプ融合戦略をさらに開発します。広範な実験により、私たちの方法は次のことが示されています。(i)より正確なプロトタイプを取得する。 (ii)誘導および変換FSL設定の両方で優れたパフォーマンスを実現します。
Few-shot learning aims to recognize novel classes with few examples. Pre-training based methods effectively tackle the problem by pre-training a feature extractor and then fine-tuning it through the nearest centroid based meta-learning. However, results show that the fine-tuning step makes marginal improvements. In this paper, 1) we figure out the reason, i.e., in the pre-trained feature space, the base classes already form compact clusters while novel classes spread as groups with large variances, which implies that fine-tuning feature extractor is less meaningful; 2) instead of fine-tuning feature extractor, we focus on estimating more representative prototypes. Consequently, we propose a novel prototype completion based meta-learning framework. This framework first introduces primitive knowledge (i.e., class-level part or attribute annotations) and extracts representative features for seen attributes as priors. Second, a part/attribute transfer network is designed to learn to infer the representative features for unseen attributes as supplementary priors. Finally, a prototype completion network is devised to learn to complete prototypes with these priors. Moreover, to avoid the prototype completion error, we further develop a Gaussian based prototype fusion strategy that fuses the mean-based and completed prototypes by exploiting the unlabeled samples. Extensive experiments show that our method: (i) obtains more accurate prototypes; (ii) achieves superior performance on both inductive and transductive FSL settings.
updated: Wed Aug 11 2021 03:44:00 GMT+0000 (UTC)
published: Wed Aug 11 2021 03:44:00 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト