arXiv reaDer
ゼロショット構成学習のためのタスク認識機能の生成
Task-Aware Feature Generation for Zero-Shot Compositional Learning
 視覚的な概念(たとえば、赤いリンゴ、大きな象)は、多くの場合、意味的に構成的であり、構成の各要素を再利用して、新しい概念(たとえば、赤い象)を構築できます。意味的構成性を利用して画像特徴分布を生成する構成的特徴合成は、サンプル効率の良いモデルの一般化への有望なアプローチです。この作業では、以前に見た概念から知識を転送することによって新しい視覚概念の機能を生成する、構成学習のためのタスク認識機能生成(TFG)フレームワークを提案します。これらの合成機能は、分類子をトレーニングして、新しい概念をゼロショットで認識するために使用されます。私たちの斬新なTFG設計は、レイヤーごとにタスク条件付きノイズを注入し、各レベルでタスク関連の変動を生成します。提案されたジェネレーター設計により、分類精度とサンプル効率が向上することがわかります。私たちのモデルは、3つのゼロショット構成学習(ZSCL)ベンチマークで新しい最先端の技術を確立し、以前の判別モデルを大幅に上回っています。私たちのモデルは、一般化されたZSCL設定で2倍以上先行技術のパフォーマンスを向上させます。
Visual concepts (e.g., red apple, big elephant) are often semantically compositional and each element of the compositions can be reused to construct novel concepts (e.g., red elephant). Compositional feature synthesis, which generates image feature distributions exploiting the semantic compositionality, is a promising approach to sample-efficient model generalization. In this work, we propose a task-aware feature generation (TFG) framework for compositional learning, which generates features of novel visual concepts by transferring knowledge from previously seen concepts. These synthetic features are then used to train a classifier to recognize novel concepts in a zero-shot manner. Our novel TFG design injects task-conditioned noise layer-by-layer, producing task-relevant variation at each level. We find the proposed generator design improves classification accuracy and sample efficiency. Our model establishes a new state of the art on three zero-shot compositional learning (ZSCL) benchmarks, outperforming the previous discriminative models by a large margin. Our model improves the performance of the prior arts by over 2x in the generalized ZSCL setting.
updated: Mon Mar 23 2020 23:57:41 GMT+0000 (UTC)
published: Tue Jun 11 2019 23:00:43 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト