arXiv reaDer
人間と物体の相互作用を検出するための空間に注意を払うグラフ
Spatio-attentive Graphs for Human-Object Interaction Detection
グラフィカルニューラルネットワークを使用して、画像内の人間と物体の相互作用を検出する問題に対処します。私たちのネットワークは、検出された人間とオブジェクトを表すノードの2部グラフを構築します。ノード間で渡されるメッセージは、相対的な空間情報と外観情報をエンコードします。外観と空間的特徴を分離する既存のアプローチとは異なり、私たちの方法は、これら2つの手がかりを単一のグラフィカルモデル内で融合し、両方のモダリティを条件とする情報が隣接ノードとの相互作用の予測に影響を与えることを可能にします。広範な実験を通じて、隣接構造、メッセージパッシング、および究極の洗練されたグラフ機能の計算において、相対的な空間情報を外観機能と融合することの利点を示します。人気のあるHICO-DETベンチマークデータセットでは、モデルは最先端のモデルを上回り、mAPは27.18で、相対的な改善は10%です。
We address the problem of detecting human--object interactions in images using graphical neural networks. Our network constructs a bipartite graph of nodes representing detected humans and objects, wherein messages passed between the nodes encode relative spatial and appearance information. Unlike existing approaches that separate appearance and spatial features, our method fuses these two cues within a single graphical model allowing information conditioned on both modalities to influence the prediction of interactions with neighboring nodes. Through extensive experimentation we demonstrate the advantages of fusing relative spatial information with appearance features in the computation of adjacency structure, message passing and the ultimate refined graph features. On the popular HICO-DET benchmark dataset, our model outperforms state-of-the-art with an mAP of 27.18, a 10% relative improvement.
updated: Fri Dec 11 2020 00:55:47 GMT+0000 (UTC)
published: Fri Dec 11 2020 00:55:47 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト