arXiv reaDer
人間と物体の相互作用を検出するための空間的に調整されたグラフ
Spatially Conditioned Graphs for Detecting Human-Object Interactions
グラフィカルニューラルネットワークを使用して、画像内の人間とオブジェクトの相互作用を検出する問題に対処します。ノードがスケーリングされているがそれ以外は同一のメッセージを各隣接ノードに送信する従来の方法とは異なり、ノードのペア間のメッセージを空間的関係に基づいて調整し、同じノードの隣接ノードに異なるメッセージを送信することを提案します。この目的のために、マルチブランチ構造の下で空間条件付けを適用するさまざまな方法を探ります。広範な実験を通じて、隣接構造、メッセージ、および洗練されたグラフ機能の計算のための空間調整の利点を示します。特に、境界ボックスの品質が向上するにつれて、それらの粗い外観の特徴が、空間情報と比較して相互作用の曖昧性解消に比較的少なく寄与することを経験的に示します。私たちの方法は、HICO-DETで31.33%、V-COCOで54.2%のmAPを達成し、微調整された検出で最先端を大幅に上回っています。
We address the problem of detecting human-object interactions in images using graphical neural networks. Unlike conventional methods, where nodes send scaled but otherwise identical messages to each of their neighbours, we propose to condition messages between pairs of nodes on their spatial relationships, resulting in different messages going to neighbours of the same node. To this end, we explore various ways of applying spatial conditioning under a multi-branch structure. Through extensive experimentation we demonstrate the advantages of spatial conditioning for the computation of the adjacency structure, messages and the refined graph features. In particular, we empirically show that as the quality of the bounding boxes increases, their coarse appearance features contribute relatively less to the disambiguation of interactions compared to the spatial information. Our method achieves an mAP of 31.33% on HICO-DET and 54.2% on V-COCO, significantly outperforming state-of-the-art on fine-tuned detections.
updated: Wed Mar 31 2021 05:34:25 GMT+0000 (UTC)
published: Fri Dec 11 2020 00:55:47 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト