arXiv reaDer
少数ショット学習のための不変表現と同変表現の補完的な強みの調査
Exploring Complementary Strengths of Invariant and Equivariant Representations for Few-Shot Learning
多くの現実の問題では、多数のラベル付きサンプルを収集することは実行不可能です。少数ショット学習(FSL)は、この問題に対処するための主要なアプローチであり、目的は、限られた数のサンプルが存在する場合に新しいカテゴリにすばやく適応することです。 FSLタスクは、勾配ベースのメタ学習およびメトリック学習アプローチからのアイデアを活用することによって主に解決されています。ただし、最近の研究では、既存の高度なFSLアルゴリズムよりも優れたパフォーマンスを発揮できる単純な埋め込みネットワークを使用した強力な機能表現の重要性が実証されています。この作業では、この洞察に基づいて、幾何学的変換の一般的なセットに同変と不変性を同時に適用する新しいトレーニングメカニズムを提案します。同変または不変性は、以前の作品でスタンドアロンで採用されていました。ただし、私たちの知る限り、これらは共同で使用されていません。これらの対照的な目的の両方を同時に最適化することで、モデルは、入力変換から独立しているだけでなく、幾何学的変換の構造をエンコードする機能も共同で学習できます。これらの補完的な機能セットは、わずかなデータサンプルで新しいクラスにうまく一般化するのに役立ちます。新しい自己監視蒸留対物レンズを組み込むことにより、さらなる改善を実現します。私たちの広範な実験は、知識の蒸留がなくても、提案された方法が5つの人気のあるベンチマークデータセットで現在の最先端のFSL方法よりも優れていることを示しています。
In many real-world problems, collecting a large number of labeled samples is infeasible. Few-shot learning (FSL) is the dominant approach to address this issue, where the objective is to quickly adapt to novel categories in presence of a limited number of samples. FSL tasks have been predominantly solved by leveraging the ideas from gradient-based meta-learning and metric learning approaches. However, recent works have demonstrated the significance of powerful feature representations with a simple embedding network that can outperform existing sophisticated FSL algorithms. In this work, we build on this insight and propose a novel training mechanism that simultaneously enforces equivariance and invariance to a general set of geometric transformations. Equivariance or invariance has been employed standalone in the previous works; however, to the best of our knowledge, they have not been used jointly. Simultaneous optimization for both of these contrasting objectives allows the model to jointly learn features that are not only independent of the input transformation but also the features that encode the structure of geometric transformations. These complementary sets of features help generalize well to novel classes with only a few data samples. We achieve additional improvements by incorporating a novel self-supervised distillation objective. Our extensive experimentation shows that even without knowledge distillation our proposed method can outperform current state-of-the-art FSL methods on five popular benchmark datasets.
updated: Mon Apr 19 2021 17:58:23 GMT+0000 (UTC)
published: Mon Mar 01 2021 21:14:33 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト