メタ学習は、限られた注釈付きデータで視覚認識システムが構築される、数ショットの画像分類に向けた実用的なアプローチになります。埋め込みなどの誘導バイアスは、十分なラベルの付いた例が設定された基本クラスから学習され、新しいクラスを使用した数ショットのタスクに一般化されます。驚いたことに、基本クラスセットのラベルは不要であり、識別可能な埋め込みは教師なしの方法でメタ学習される可能性があることがわかりました。包括的な分析は、2つの変更(半正規化された距離メトリックと十分なサンプリング)が教師なしメタ学習(UML)を大幅に改善することを示しています。変更されたベースラインに基づいて、UMLモデルをトレーニングするときに、タスクの特性をさらに増幅または補正します。まず、混合埋め込みが組み込まれており、数ショットのタスクの難易度が高くなっています。次に、タスク固有の埋め込み変換を利用して、タスク間の特定のプロパティを処理し、バニラ埋め込みへの一般化機能を維持します。数ショットの学習ベンチマークでの実験により、私たちのアプローチが以前のUMLメソッドよりも4〜10%のパフォーマンスギャップで優れていることが確認され、UMLで学習した埋め込みは、教師ありバリアントと同等またはそれ以上のパフォーマンスを達成します。
Meta-learning becomes a practical approach towards few-shot image classification, where a visual recognition system is constructed with limited annotated data. Inductive bias such as embedding is learned from a base class set with ample labeled examples and then generalizes to few-shot tasks with novel classes. Surprisingly, we find that the base class set labels are not necessary, and discriminative embeddings could be meta-learned in an unsupervised manner. Comprehensive analyses indicate two modifications -- the semi-normalized distance metric and the sufficient sampling -- improves unsupervised meta-learning (UML) significantly. Based on the modified baseline, we further amplify or compensate for the characteristic of tasks when training a UML model. First, mixed embeddings are incorporated to increase the difficulty of few-shot tasks. Next, we utilize a task-specific embedding transformation to deal with the specific properties among tasks, maintaining the generalization ability into the vanilla embeddings. Experiments on few-shot learning benchmarks verify that our approaches outperform previous UML methods by a 4-10% performance gap, and embeddings learned with our UML achieve comparable or even better performance than its supervised variants.