arXiv reaDer
セマンティック監視:出力スペースの一般化を可能にする
Semantic Supervision: Enabling Generalization over Output Spaces
この論文では、セマンティック監視(SemSup)を提案します。これは、出力スペースを一般化する分類器をトレーニングするための統一されたパラダイムです。クラスを離散シンボルとして扱う標準的な分類とは対照的に、SemSupは、クラスの説明から取得された高密度のベクトル特徴としてそれらを表します(たとえば、「猫は小さな肉食性の哺乳類です」)。これにより、出力スペースを(説明のスペースで)無制限にすることができ、モデルが目に見えない入力と目に見えない出力の両方を一般化できるようになります(たとえば、「ツチブタは耳の長い夜行性の穴を掘る哺乳類です」)。具体的には、SemSupは、(1)見えないクラスの説明、(2)見えないクラス、(3)見えないスーパークラス、(4)見えないタスクの4種類の一般化を可能にします。 2つのバリアント(マルチクラスとマルチラベル)、2つの入力モダリティ(テキストと画像)、および2つの出力記述モダリティ(テキストとJSON)にわたる4つの分類データセットの実験を通じて、SemSupモデルが標準の監視対象モデルを大幅に上回っていることを示しますクラス名に単語の埋め込みを利用する既存のモデル。たとえば、私たちのモデルは、ニュース分類データセット(RCV1)で、目に見えない説明とクラスでそれぞれ40%と15%の精度でベースラインを上回っています。 SemSupは、ニューラルモデルを大きな無制限の出力スペースにスケーリングし、目に見えないタスクとドメインのより良い一般化とモデルの再利用を可能にするための経路として機能します。
In this paper, we propose Semantic Supervision (SemSup) - a unified paradigm for training classifiers that generalize over output spaces. In contrast to standard classification, which treats classes as discrete symbols, SemSup represents them as dense vector features obtained from descriptions of classes (e.g., "The cat is a small carnivorous mammal"). This allows the output space to be unbounded (in the space of descriptions) and enables models to generalize both over unseen inputs and unseen outputs (e.g. "The aardvark is a nocturnal burrowing mammal with long ears"). Specifically, SemSup enables four types of generalization, to -- (1) unseen class descriptions, (2) unseen classes, (3) unseen super-classes, and (4) unseen tasks. Through experiments on four classification datasets across two variants (multi-class and multi-label), two input modalities (text and images), and two output description modalities (text and JSON), we show that our SemSup models significantly outperform standard supervised models and existing models that leverage word embeddings over class names. For instance, our model outperforms baselines by 40% and 15% precision points on unseen descriptions and classes, respectively, on a news categorization dataset (RCV1). SemSup can serve as a pathway for scaling neural models to large unbounded output spaces and enabling better generalization and model reuse for unseen tasks and domains.
updated: Tue Mar 15 2022 07:46:23 GMT+0000 (UTC)
published: Sat Feb 26 2022 09:55:54 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト