Adaptive Confidence Smoothing for Generalized Zero-Shot Learning
  一般化されたゼロショット学習(GZSL)は、一部のクラスにサンプルがあり、他のクラスがセマンティック属性やテキスト記述などのサイド情報からゼロショット学習(ZSL)で学習される分類子を学習する問題です。これら2つの体制で同時に動作する単一のモデルをトレーニングすることは困難です。ここでは、モデルを3つのモジュールコンポーネントに分割し、それらを一貫した方法で組み合わせる確率的アプローチについて説明します。具体的には、モデルは3つの分類子で構成されています。サンプルが「見られた」クラスからのものである場合にソフトな決定を行う「ゲーティング」モデルと、ZSLエキスパートと見られたクラスのエキスパートモデルの2つのエキスパートです。このアプローチの2つの主な問題に対処します。見えないクラスのトレーニングサンプルなしで、ゲーティング確率の正確な推定値を提供する方法。ドメイン外のサンプルを観察する際に専門家の予測を使用する方法。アプローチの重要な洞察は、3つのモデル間で情報を受け渡し、モジュール構造を維持しながら各モデルの精度を向上させることです。 4つの標準GZSLベンチマークデータセットでアプローチ、適応信頼性平滑化(COSMO)をテストし、最先端のGZSLモデルを大幅に上回ることがわかりました。 COSMOは、ギャップを埋め、GZSLの生成モデルのパフォーマンスを上回る最初のモデルでもありますが、トレーニングと調整がはるかに簡単な軽量モデルです。特に、COSMOはゼロショットモデルを開発するための新しいビューを提供します。 COSMOのモジュール構造のおかげで、モデルは、見えているクラスと見えないクラスの両方でうまく機能するのではなく、見えないクラスの正確な分類に焦点を当て、後で見られるクラスモデルを考慮することができます。
Generalized zero-shot learning (GZSL) is the problem of learning a classifier where some classes have samples and others are learned from side information, like semantic attributes or text description, in a zero-shot learning fashion (ZSL). Training a single model that operates in these two regimes simultaneously is challenging. Here we describe a probabilistic approach that breaks the model into three modular components, and then combines them in a consistent way. Specifically, our model consists of three classifiers: A "gating" model that makes soft decisions if a sample is from a "seen" class, and two experts: a ZSL expert, and an expert model for seen classes. We address two main difficulties in this approach: How to provide an accurate estimate of the gating probability without any training samples for unseen classes; and how to use expert predictions when it observes samples outside of its domain. The key insight to our approach is to pass information between the three models to improve each one's accuracy, while maintaining the modular structure. We test our approach, adaptive confidence smoothing (COSMO), on four standard GZSL benchmark datasets and find that it largely outperforms state-of-the-art GZSL models. COSMO is also the first model that closes the gap and surpasses the performance of generative models for GZSL, even-though it is a light-weight model that is much easier to train and tune. Notably, COSMO offers a new view for developing zero-shot models. Thanks to COSMO's modular structure, instead of trying to perform well both on seen and on unseen classes, models can focus on accurate classification of unseen classes, and later consider seen class models.
updated: Mon Oct 07 2019 16:01:33 GMT+0000 (UTC)
published: Mon Dec 24 2018 11:54:41 GMT+0000 (UTC)
