arXiv reaDer
人間と物体の相互作用をより適切に検出するためのカテゴリ対応トランスフォーマーネットワーク
Category-Aware Transformer Network for Better Human-Object Interaction Detection
静止画像を理解するには、人間と関連するオブジェクトの相互作用を認識しながらローカライズすることを目的とした、人間とオブジェクトの相互作用(HOI)の検出が不可欠です。最近、トランスベースのモデルは、HOI検出の進歩を大幅に進歩させました。ただし、モデルのオブジェクトクエリは常にゼロとして初期化されるため、これらのモデルの機能は十分に検討されていません。これは、パフォーマンスに影響を及ぼします。このホワイトペーパーでは、カテゴリ対応のセマンティック情報を使用してオブジェクトクエリを初期化することにより、トランスフォーマーベースのHOI検出器を促進する問題を調査します。この目的のために、Category-Aware Transformer Network(CATN)を革新的に提案します。具体的には、オブジェクトクエリは、パフォーマンスを向上させるために、外部オブジェクト検出モデルによって表されるカテゴリの優先順位を介して初期化されます。さらに、そのようなカテゴリーの事前分布は、注意メカニズムを介して特徴の表現能力を強化するためにさらに使用することができる。最初に、グラウンドトゥルースカテゴリ情報を使用してオブジェクトクエリを初期化することにより、Oracleの実験を通じてアイデアを検証しました。そして、私たちのアイデアを備えたHOI検出モデルがベースラインを大幅に上回り、新しい最先端の結果を達成することを示すために、広範な実験が行われました。
Human-Object Interactions (HOI) detection, which aims to localize a human and a relevant object while recognizing their interaction, is crucial for understanding a still image. Recently, transformer-based models have significantly advanced the progress of HOI detection. However, the capability of these models has not been fully explored since the Object Query of the model is always simply initialized as just zeros, which would affect the performance. In this paper, we try to study the issue of promoting transformer-based HOI detectors by initializing the Object Query with category-aware semantic information. To this end, we innovatively propose the Category-Aware Transformer Network (CATN). Specifically, the Object Query would be initialized via category priors represented by an external object detection model to yield better performance. Moreover, such category priors can be further used for enhancing the representation ability of features via the attention mechanism. We have firstly verified our idea via the Oracle experiment by initializing the Object Query with the groundtruth category information. And then extensive experiments have been conducted to show that a HOI detection model equipped with our idea outperforms the baseline by a large margin to achieve a new state-of-the-art result.
updated: Mon May 09 2022 09:28:28 GMT+0000 (UTC)
published: Mon Apr 11 2022 07:21:24 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト