arXiv reaDer
Alleviating Feature Confusion for Generative Zero-shot Learning
  最近、生成的敵対ネットワーク(GAN)がゼロショット学習(ZSL)に正常に適用され、最先端のパフォーマンスが達成されました。仮想の目に見えない視覚的特徴を合成することにより、GANベースの方法は、困難なZSLタスクを教師付き学習問題に変換します。ただし、GANベースのZSLメソッドは、表示されたカテゴリでジェネレーターをトレーニングし、さらに表示されていないインスタンスに適用する必要があります。このようなパラダイムの避けられない問題は、合成された目に見えない特徴が参照されやすく、実際の目に見えないインスタンスの新規性と多様性を反映できないことです。一言で言えば、合成された機能は紛らわしいです。合成された機能を使用して、表示されているカテゴリと表示されていないカテゴリを区別することはできません。その結果、合成された特徴は微妙すぎるため、テスト段階で見られたカテゴリと見えないカテゴリの両方を含む一般化されたゼロショット学習(GZSL)に分類できません。このペーパーでは、最初に機能の混乱の問題を紹介します。次に、問題を解決するために、機能の混乱を緩和するGAN(AFC-GAN)という名前の新しい機能生成ネットワークを提案します。具体的には、見たカテゴリーと見えないカテゴリーの決定境界を最大化する境界損失を提示します。さらに、機能の混乱を定量化するために、機能の混乱スコア(FCS)という名前の新しいメトリックが提案されています。 5つの広く使用されているデータセットでの広範な実験により、ZSLおよびGZSLの両方のプロトコルで、この方法が以前の最先端技術よりも優れていることが確認されました。
Lately, generative adversarial networks (GANs) have been successfully applied to zero-shot learning (ZSL) and achieved state-of-the-art performance. By synthesizing virtual unseen visual features, GAN-based methods convert the challenging ZSL task into a supervised learning problem. However, GAN-based ZSL methods have to train the generator on the seen categories and further apply it to unseen instances. An inevitable issue of such a paradigm is that the synthesized unseen features are prone to seen references and incapable to reflect the novelty and diversity of real unseen instances. In a nutshell, the synthesized features are confusing. One cannot tell unseen categories from seen ones using the synthesized features. As a result, the synthesized features are too subtle to be classified in generalized zero-shot learning (GZSL) which involves both seen and unseen categories at the test stage. In this paper, we first introduce the feature confusion issue. Then, we propose a new feature generating network, named alleviating feature confusion GAN (AFC-GAN), to challenge the issue. Specifically, we present a boundary loss which maximizes the decision boundary of seen categories and unseen ones. Furthermore, a novel metric named feature confusion score (FCS) is proposed to quantify the feature confusion. Extensive experiments on five widely used datasets verify that our method is able to outperform previous state-of-the-arts under both ZSL and GZSL protocols.
updated: Tue Sep 17 2019 06:59:48 GMT+0000 (UTC)
published: Tue Sep 17 2019 06:59:48 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト