arXiv reaDer
ConsNet:ゼロショットの人間と物体の相互作用を検出するための一貫性グラフの学習
ConsNet: Learning Consistency Graph for Zero-Shot Human-Object Interaction Detection
ヒューマンオブジェクトインタラクション(HOI)検出の問題を検討します。これは、次の形式でHOIインスタンスを見つけて認識することを目的としています。画像で。ほとんどの既存の作品は、HOIを個別の相互作用カテゴリとして扱っているため、ロングテール分布とアクションラベルの多義性の問題を処理できません。オブジェクト、アクション、および相互作用の間のマルチレベルの一貫性は、まれな、または以前は見られなかったHOIのセマンティック表現を生成するための強力な手がかりであると主張します。 HOIラベルの構成的および関係的特性を活用して、オブジェクト、アクション、および相互作用間の関係を整合性グラフと呼ばれる無向グラフに明示的にエンコードし、グラフ注意ネットワーク(GAT)を活用して知識を伝播する知識認識フレームワークであるConsNetを提案します。 HOIカテゴリとその構成要素。私たちのモデルは、候補となる人間とオブジェクトのペアの視覚的特徴とHOIラベルの単語埋め込みを入力として受け取り、それらを視覚的意味的結合埋め込み空間にマッピングし、それらの類似性を測定することによって検出結果を取得します。挑戦的なV-COCOおよびHICO-DETデータセットでモデルを広範囲に評価し、結果は、完全に監視された設定とゼロショット設定の両方で、私たちのアプローチが最先端の設定よりも優れていることを検証します。コードはhttps://github.com/yeliudev/ConsNetで入手できます。
We consider the problem of Human-Object Interaction (HOI) Detection, which aims to locate and recognize HOI instances in the form of in images. Most existing works treat HOIs as individual interaction categories, thus can not handle the problem of long-tail distribution and polysemy of action labels. We argue that multi-level consistencies among objects, actions and interactions are strong cues for generating semantic representations of rare or previously unseen HOIs. Leveraging the compositional and relational peculiarities of HOI labels, we propose ConsNet, a knowledge-aware framework that explicitly encodes the relations among objects, actions and interactions into an undirected graph called consistency graph, and exploits Graph Attention Networks (GATs) to propagate knowledge among HOI categories as well as their constituents. Our model takes visual features of candidate human-object pairs and word embeddings of HOI labels as inputs, maps them into visual-semantic joint embedding space and obtains detection results by measuring their similarities. We extensively evaluate our model on the challenging V-COCO and HICO-DET datasets, and results validate that our approach outperforms state-of-the-arts under both fully-supervised and zero-shot settings. Code is available at https://github.com/yeliudev/ConsNet.
updated: Sun Mar 27 2022 07:49:43 GMT+0000 (UTC)
published: Fri Aug 14 2020 09:11:18 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト