ゼロショット学習は、手作業で設計された属性や学習された埋め込みなどのセマンティッククラス表現に依存して、ラベル付きの例なしでクラスを予測します。常識的な知識グラフからノードをベクトル空間に埋め込むことにより、クラス表現を学習することを提案します。常識的な知識グラフは、さまざまなタスクに適用するために人間の努力をほとんど必要としない、明示的な高レベルの知識の未開発のソースです。グラフの知識を取り込むために、クラス表現を生成するための新しいトランスフォーマーグラフ畳み込みネットワーク(TrGCN)を備えた汎用フレームワークであるZSL-KGを紹介します。提案されたTrGCNアーキテクチャは、ノード近傍の非線形結合を計算します。私たちの結果は、ZSL-KGが、言語とビジョンの6つのゼロショットベンチマークデータセットのうち5つで、既存のWordNetベースの方法よりも優れていることを示しています。
Zero-shot learning relies on semantic class representations such as hand-engineered attributes or learned embeddings to predict classes without any labeled examples. We propose to learn class representations by embedding nodes from common sense knowledge graphs in a vector space. Common sense knowledge graphs are an untapped source of explicit high-level knowledge that requires little human effort to apply to a range of tasks. To capture the knowledge in the graph, we introduce ZSL-KG, a general-purpose framework with a novel transformer graph convolutional network (TrGCN) for generating class representations. Our proposed TrGCN architecture computes non-linear combinations of node neighbourhoods. Our results show that ZSL-KG improves over existing WordNet-based methods on five out of six zero-shot benchmark datasets in language and vision.