ゼロショット学習(ZSL)は、クラスのセマンティックな記述のみに基づいて、目に見えないクラスのインスタンスを認識することを目的としています。通常、既存のアルゴリズムは、ある機能空間から別の機能空間へのマッピングを学習することにより、セマンティックビジュアル対応の問題として定式化します。合理的であるにもかかわらず、以前のアプローチは、本質的に視覚的特徴の非常に貴重な識別力を暗黙的に破棄し、したがって望ましくない結果を生み出します。その代わりに、ZSLを条件付き視覚分類問題として再定式化します。つまり、セマンティック記述から学習した分類子に基づいて視覚機能を分類します。この再定式化により、さまざまなZSL設定を対象とするアルゴリズムを開発します。従来の設定では、エピソードベースのトレーニングスキームでセマンティック属性から視覚的特徴分類子を直接生成するディープニューラルネットワークをトレーニングすることを提案します。一般化された設定では、見られたクラスの高度に識別された分類器と見えないクラスの生成された分類器を連結して、すべてのクラスの視覚的特徴を分類します。トランスダクティブ設定では、ラベルなしデータを活用して、新しい学習を忘れずに自己学習メカニズムを使用して分類子ジェネレーターを効果的に較正し、堅牢な一般化クロスエントロピー損失によってプロセスをガイドします。広範な実験により、提案されたアルゴリズムは、すべてのZSL設定のほとんどのベンチマークデータセットで大きなマージンを確保して、最先端の方法を大幅に上回ることが示されています。コードはhttps://github.com/kailigo/cvcZSLから入手できます
Zero-shot learning (ZSL) aims to recognize instances of unseen classes solely based on the semantic descriptions of the classes. Existing algorithms usually formulate it as a semantic-visual correspondence problem, by learning mappings from one feature space to the other. Despite being reasonable, previous approaches essentially discard the highly precious discriminative power of visual features in an implicit way, and thus produce undesirable results. We instead reformulate ZSL as a conditioned visual classification problem, i.e., classifying visual features based on the classifiers learned from the semantic descriptions. With this reformulation, we develop algorithms targeting various ZSL settings: For the conventional setting, we propose to train a deep neural network that directly generates visual feature classifiers from the semantic attributes with an episode-based training scheme; For the generalized setting, we concatenate the learned highly discriminative classifiers for seen classes and the generated classifiers for unseen classes to classify visual features of all classes; For the transductive setting, we exploit unlabeled data to effectively calibrate the classifier generator using a novel learning-without-forgetting self-training mechanism and guide the process by a robust generalized cross-entropy loss. Extensive experiments show that our proposed algorithms significantly outperform state-of-the-art methods by large margins on most benchmark datasets in all the ZSL settings. Our code is available at https://github.com/kailigo/cvcZSL