Convolutional Prototype Learning for Zero-Shot Recognition
 ゼロショット学習(ZSL)は、近年、特にきめの細かいオブジェクトの認識、検索、画像キャプションの分野で注目を集めています。 ZSLの鍵は、補助クラスの属性ベクトルを介して、見たクラスから見えないクラスに知識を転送することです。ただし、以前の作品で一般的に学習されていた投影関数は、サンプルレベルで見られたドメインと見えないドメイン間の分布の一貫性を前提としているため、一般化できません。本論文では、ゼロショット認識のためのシンプルかつ効果的な畳み込みプロトタイプ学習(CPL)フレームワークを提案します。タスクレベルでの分布の一貫性を前提とすることで、CPLは知識をスムーズに転送して目に見えないサンプルを認識できるようになります。さらに、各タスク内では、距離ベースのトレーニングメカニズムを介して識別視覚プロトタイプが学習されます。その結果、セマンティック空間ではなく、視覚空間で認識を実行できます。その後、広範な実験グループが慎重に設計および提示され、CPLがさまざまな設定で現在利用可能な代替案よりも有利な効果を得ることが実証されています。
Zero-shot learning (ZSL) has received increasing attention in recent years especially in areas of fine-grained object recognition, retrieval, and image captioning. The key to ZSL is to transfer knowledge from the seen to the unseen classes via auxiliary class attribute vectors. However, the popularly learned projection functions in previous works cannot generalize well since they assume the distribution consistency between seen and unseen domains at sample-level.Besides, the provided non-visual and unique class attributes can significantly degrade the recognition performance in semantic space. In this paper, we propose a simple yet effective convolutional prototype learning (CPL) framework for zero-shot recognition. By assuming distribution consistency at task-level, our CPL is capable of transferring knowledge smoothly to recognize unseen samples.Furthermore, inside each task, discriminative visual prototypes are learned via a distance based training mechanism. Consequently, we can perform recognition in visual space, instead of semantic space. An extensive group of experiments are then carefully designed and presented, demonstrating that CPL obtains more favorable effectiveness, over currently available alternatives under various settings.
updated: Tue Feb 11 2020 02:56:56 GMT+0000 (UTC)
published: Tue Oct 22 2019 02:15:46 GMT+0000 (UTC)
