実世界でのオブジェクト認識には、ロングテールデータまたはオープンエンドデータの処理が必要です。理想的な視覚システムは、人口の多い頭の視覚概念を確実に認識し、その間、いくつかのトレーニングインスタンスで新しい尾のカテゴリについて効率的に学習する必要があります。クラスバランスのとれた多ショット学習と少数ショット学習は、頭の強力な分類器を学習するか、尾の少数ショット分類器を学習することによって、この問題の1つの側面に取り組みます。この論文では、一般化された数ショット学習(GFSL)の問題を調査します。展開中のモデルは、数ショットのテールカテゴリについて学習し、同時にヘッドクラスを分類するために必要です。 ClAssifier SynThesis LEarning(CASTLE)を提案します。これは、共有ニューラル辞書を使用してヘッドクラスのマルチクラス分類器に加えて、キャリブレーションされた数ショット分類器を合成する方法を学習し、帰納的GFSLに光を当てる学習フレームワークです。さらに、CASTLE(ACASTLE)の適応バージョンを提案します。これは、着信テールトレーニングの例を条件とするヘッド分類子を適応させ、効果的な後方知識伝達を可能にするフレームワークを生成します。結果として、ACASTLEは異種ドメインのクラスでGFSLを効果的に処理できます。 CASTLEとACASTLEは、既存のGFSLアルゴリズムよりも優れたパフォーマンスと、MiniImageNetおよびTieredImageNetデータセットでの強力なベースラインを示しています。さらに興味深いことに、標準的な数ショットの学習基準で評価した場合、それらは以前の最先端の方法よりも優れています。
Object recognition in the real-world requires handling long-tailed or even open-ended data. An ideal visual system needs to recognize the populated head visual concepts reliably and meanwhile efficiently learn about emerging new tail categories with a few training instances. Class-balanced many-shot learning and few-shot learning tackle one side of this problem, by either learning strong classifiers for head or learning to learn few-shot classifiers for the tail. In this paper, we investigate the problem of generalized few-shot learning (GFSL) -- a model during the deployment is required to learn about tail categories with few shots and simultaneously classify the head classes. We propose the ClAssifier SynThesis LEarning (CASTLE), a learning framework that learns how to synthesize calibrated few-shot classifiers in addition to the multi-class classifiers of head classes with a shared neural dictionary, shedding light upon the inductive GFSL. Furthermore, we propose an adaptive version of CASTLE (ACASTLE) that adapts the head classifiers conditioned on the incoming tail training examples, yielding a framework that allows effective backward knowledge transfer. As a consequence, ACASTLE can handle GFSL with classes from heterogeneous domains effectively. CASTLE and ACASTLE demonstrate superior performances than existing GFSL algorithms and strong baselines on MiniImageNet as well as TieredImageNet datasets. More interestingly, they outperform previous state-of-the-art methods when evaluated with standard few-shot learning criteria.