arXiv reaDer
適応セット予測としてのHOI検出の再定式化
Reformulating HOI Detection as Adaptive Set Prediction
どの画像領域に集中するかを決定することは、ヒューマンオブジェクトインタラクション(HOI)の検出にとって重要です。従来のHOI検出器は、検出された人間と物体のペア、または事前定義された相互作用の場所のいずれかに焦点を合わせているため、効果的な機能の学習が制限されます。この論文では、HOI検出を適応セット予測問題として再定式化し、この新しい定式化を使用して、並列インスタンスと相互作用ブランチを備えた適応セットベースの1ステージフレームワーク(AS-Net)を提案します。これを実現するために、トレーニング可能なインタラクションクエリセットをトランスフォーマーを使用したインタラクション予測セットにマッピングします。各クエリは、マルチヘッドの共同注意を通じて、グローバルコンテキストからのインタラクション関連の機能を適応的に集約します。さらに、トレーニングプロセスは、各グラウンドトゥルースを相互作用予測と照合することによって適応的に監視されます。さらに、インスタンスブランチからインタラクションブランチに有益な機能を導入するための効果的なインスタンス認識アテンションモジュールを設計します。私たちの方法は、3つの挑戦的なHOI検出データセットで、人間のポーズや言語機能を追加することなく、以前の最先端の方法よりも優れています。特に、大規模なHICO-DETデータセットで31%を超える相対的な改善を達成しています。コードはhttps://github.com/yoyomimi/AS-Netで入手できます。
Determining which image regions to concentrate on is critical for Human-Object Interaction (HOI) detection. Conventional HOI detectors focus on either detected human and object pairs or pre-defined interaction locations, which limits learning of the effective features. In this paper, we reformulate HOI detection as an adaptive set prediction problem, with this novel formulation, we propose an Adaptive Set-based one-stage framework (AS-Net) with parallel instance and interaction branches. To attain this, we map a trainable interaction query set to an interaction prediction set with a transformer. Each query adaptively aggregates the interaction-relevant features from global contexts through multi-head co-attention. Besides, the training process is supervised adaptively by matching each ground-truth with the interaction prediction. Furthermore, we design an effective instance-aware attention module to introduce instructive features from the instance branch into the interaction branch. Our method outperforms previous state-of-the-art methods without any extra human pose and language features on three challenging HOI detection datasets. Especially, we achieve over 31% relative improvement on a large scale HICO-DET dataset. Code is available at https://github.com/yoyomimi/AS-Net.
updated: Wed Mar 10 2021 10:40:33 GMT+0000 (UTC)
published: Wed Mar 10 2021 10:40:33 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト