視覚物体認識の進歩にも関わらず、最先端の深層学習モデルは、限られた数の例しか提供されない数ショット設定で新しい物体を効果的に認識するのに苦労しています。このようなタスクに優れた人間とは異なり、これらのモデルは、そのようなオブジェクトについて結論を引き出すためにエンティティ間の既知の関係を活用できないことがよくあります。この研究では、シンボリック ナレッジ グラフを最先端の認識モデルに組み込むことで、効果的な少数ショット分類のための新しいアプローチが可能になることを示します。私たちが提案するニューロシンボリックアーキテクチャとトレーニング方法論では、ナレッジグラフは少数の例から抽出された追加の関係で強化され、相互接続されたエンティティの存在を考慮することで新しいオブジェクトを認識する能力が向上します。既存の少数ショット分類子とは異なり、これによりモデルにオブジェクトだけでなく抽象的な概念やアフォーダンスも組み込むことができることを示します。ナレッジ グラフの存在により、このアプローチは、その中に含まれる関係の分析を通じて解釈可能になります。私たちのアプローチは、COCO データセットに対する現在の最先端の少数ショット マルチラベル分類法よりも優れていることを経験的に示し、Visual Genome データセットに対する抽象概念とアフォーダンスの追加を評価します。
Despite the advances made in visual object recognition, state-of-the-art deep learning models struggle to effectively recognize novel objects in a few-shot setting where only a limited number of examples are provided. Unlike humans who excel at such tasks, these models often fail to leverage known relationships between entities in order to draw conclusions about such objects. In this work, we show that incorporating a symbolic knowledge graph into a state-of-the-art recognition model enables a new approach for effective few-shot classification. In our proposed neuro-symbolic architecture and training methodology, the knowledge graph is augmented with additional relationships extracted from a small set of examples, improving its ability to recognize novel objects by considering the presence of interconnected entities. Unlike existing few-shot classifiers, we show that this enables our model to incorporate not only objects but also abstract concepts and affordances. The existence of the knowledge graph also makes this approach amenable to interpretability through analysis of the relationships contained within it. We empirically show that our approach outperforms current state-of-the-art few-shot multi-label classification methods on the COCO dataset and evaluate the addition of abstract concepts and affordances on the Visual Genome dataset.