ゼロショット学習(ZSL)は分類タスクであり、目に見えないクラスのセットからのトレーニングラベル付きの例が1つもありません。代わりに、多くの場合、物理的に実現可能な属性または説明的な属性の形式で、表示されているクラスと表示されていないクラスに関する事前情報(または説明)しかありません。一連のクラスからの単一のトレーニング例の欠如は、一般的なクロスエントロピー損失を含む、標準的な分類手法と損失の使用を禁止します。現在、最先端のアプローチは、以前のクラス情報を密なベクトルにエンコードし、入力ベクトルの学習された投影と対応するクラスベクトル(まとめて埋め込みモデルと呼ばれます)の間の距離を最適化します。この論文では、クロスエントロピー損失を伴う標準的なニューラルネットワークとしてゼロショット学習をキャストする新しいアーキテクチャを提案します。トレーニング中、私たちのアプローチは、見られたクラスの観測されたトレーニングデータを、トレーニングデータまたは見えないクラスがない属性からの類似性情報と組み合わせることによってソフトラベル付けを実行します。私たちの知る限り、このような類似性に基づくソフトラベリングはディープラーニングの分野では検討されていません。ゼロショット学習の4つのベンチマークデータセット、AwA、aPY、SUN、およびCUBデータセットで提案されたモデルを評価し、このモデルがGeneralized-ZSLおよびZSL設定の最先端の方法よりも大幅に改善されていることを示します。これらすべてのデータセットで一貫して。
Zero-Shot Learning (ZSL) is a classification task where we do not have even a single training labeled example from a set of unseen classes. Instead, we only have prior information (or description) about seen and unseen classes, often in the form of physically realizable or descriptive attributes. Lack of any single training example from a set of classes prohibits use of standard classification techniques and losses, including the popular crossentropy loss. Currently, state-of-the-art approaches encode the prior class information into dense vectors and optimize some distance between the learned projections of the input vector and the corresponding class vector (collectively known as embedding models). In this paper, we propose a novel architecture of casting zero-shot learning as a standard neural-network with crossentropy loss. During training our approach performs soft-labeling by combining the observed training data for the seen classes with the similarity information from the attributes for which we have no training data or unseen classes. To the best of our knowledge, such similarity based soft-labeling is not explored in the field of deep learning. We evaluate the proposed model on the four benchmark datasets for zero-shot learning, AwA, aPY, SUN and CUB datasets, and show that our model achieves significant improvement over the state-of-the-art methods in Generalized-ZSL and ZSL settings on all of these datasets consistently.