arXiv reaDer
一般化されたゼロショット学習のためのメタ学習フレームワーク
A Meta-Learning Framework for Generalized Zero-Shot Learning
  テスト時に目に見えないクラスサンプルを分類する学習は、一般にゼロショット学習(ZSL)と呼ばれます。テストサンプルがトレーニング(表示された)および表示されていないクラスからのものである場合、表示されたクラスに対する強いバイアスが存在するため、より困難な問題になります。この問題は一般に\ emph {一般化されたゼロショット学習(GZSL)として知られています。 VAEやGANなどの生成モデルの最近の進歩のおかげで、この問題を解決するためにサンプル合成ベースのアプローチが大きな注目を集めています。これらのアプローチは、目に見えないクラスサンプルを合成することにより、クラスバイアスの問題を処理できます。ただし、これらのZSL / GZSLモデルは、次の重要な制限のために苦しみます。$(i)$トレーニング段階は、\ emph {表示されたクラスデータのみを使用してクラス調整ジェネレーターを学習し、トレーニング段階は明示的に生成を学習しません目に見えないクラスのサンプル。 $(ii)$彼らは、見えているクラス生成と見えないクラス生成の両方に対して簡単に一般化できる一般的な最適パラメータを学習しません。そして、$(iii)$見られるクラスごとにごく少数のサンプルにしかアクセスできない場合、これらのモデルのパフォーマンスは低下する傾向があります。この論文では、これらの制限を自然に処理するメタ学習ベースの生成モデルを提案します。提案されたモデルは、モデルに依存しないメタ学習をWasserstein GAN(WGAN)と統合して$(i)$および$(iii)$を処理することに基づいており、新しいタスク分布を使用して$(ii)$を処理します。提案されたモデルは、標準ZSLの大幅な改善と、より難しいGZSL設定をもたらします。 ZSL設定では、このモデルは、CUB、AWA1、AWA2、aPYデータセットの現在の最先端技術に対して、それぞれ4.5 \%、6.0 \%、9.8 \%、27.9 \%の相対的な改善をもたらします。
Learning to classify unseen class samples at test time is popularly referred to as zero-shot learning (ZSL). If test samples can be from training (seen) as well as unseen classes, it is a more challenging problem due to the existence of strong bias towards seen classes. This problem is generally known as \emph{generalized zero-shot learning (GZSL). Thanks to the recent advances in generative models such as VAEs and GANs, sample synthesis based approaches have gained considerable attention for solving this problem. These approaches are able to handle the problem of class bias by synthesizing unseen class samples. However, these ZSL/GZSL models suffer due to the following key limitations: $(i)$ Their training stage learns a class-conditioned generator using only \emph{seen class data and the training stage does not \emph{explicitly learn to generate the unseen class samples; $(ii)$ They do not learn a generic optimal parameter which can easily generalize for both seen and unseen class generation; and $(iii)$ If we only have access to a very few samples per seen class, these models tend to perform poorly. In this paper, we propose a meta-learning based generative model that naturally handles these limitations. The proposed model is based on integrating model-agnostic meta learning with a Wasserstein GAN (WGAN) to handle $(i)$ and $(iii)$, and uses a novel task distribution to handle $(ii)$. Our proposed model yields significant improvements on standard ZSL as well as more challenging GZSL setting. In ZSL setting, our model yields 4.5\%, 6.0\%, 9.8\%, and 27.9\% relative improvements over the current state-of-the-art on CUB, AWA1, AWA2, and aPY datasets, respectively.
updated: Tue Sep 10 2019 08:11:46 GMT+0000 (UTC)
published: Tue Sep 10 2019 08:11:46 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト