メタ学習は、数ショットの画像分類に向けた実用的なアプローチになりました。「分類器を学習する戦略」は、ラベル付けされた基本クラスでメタ学習され、新しいクラスのタスクに適用できます。基本クラスのラベルの要件を削除し、教師なしメタ学習(UML)を介して一般化可能な埋め込みを学習します。具体的には、タスクのエピソードは、メタトレーニング中にラベルなしの基本クラスからのデータ拡張を使用して構築され、メタテスト中にラベル付きの少数ショットの例を使用する新しいタスクに埋め込みベースの分類子を適用します。 2つの要素がUMLで重要な役割を果たしていることを確認します。つまり、タスクをサンプリングし、インスタンス間の類似性を測定する方法です。したがって、2つの簡単な変更で強力なベースラインを取得します。エピソードごとに複数のタスクを効率的に構築し、半正規化された類似性を備えた十分なサンプリング戦略です。次に、2つの方向からのタスクの特性を利用して、さらに改善します。まず、合成された紛らわしいインスタンスが組み込まれ、より識別力のある埋め込みを抽出できるようになります。次に、メタトレーニング中の補助コンポーネントとして追加のタスク固有の埋め込み変換を利用して、事前に適応された埋め込みの一般化機能を促進します。数ショットの学習ベンチマークでの実験により、私たちのアプローチが以前のUMLメソッドよりも優れており、監視対象のバリアントと同等またはそれ以上のパフォーマンスを達成していることが確認されています。
Meta-learning has become a practical approach towards few-shot image classification, where "a strategy to learn a classifier" is meta-learned on labeled base classes and can be applied to tasks with novel classes. We remove the requirement of base class labels and learn generalizable embeddings via Unsupervised Meta-Learning (UML). Specifically, episodes of tasks are constructed with data augmentations from unlabeled base classes during meta-training, and we apply embedding-based classifiers to novel tasks with labeled few-shot examples during meta-test. We observe two elements play important roles in UML, i.e., the way to sample tasks and measure similarities between instances. Thus we obtain a strong baseline with two simple modifications -- a sufficient sampling strategy constructing multiple tasks per episode efficiently together with a semi-normalized similarity. We then take advantage of the characteristics of tasks from two directions to get further improvements. First, synthesized confusing instances are incorporated to help extract more discriminative embeddings. Second, we utilize an additional task-specific embedding transformation as an auxiliary component during meta-training to promote the generalization ability of the pre-adapted embeddings. Experiments on few-shot learning benchmarks verify that our approaches outperform previous UML methods and achieve comparable or even better performance than its supervised variants.