arXiv reaDer
トランスフォーマーベースの人間とオブジェクトのインタラクション検出における構成学習
Compositional Learning in Transformer-Based Human-Object Interaction Detection
ヒューマン・オブジェクト・インタラクション (HOI) 検出は、人間の活動と視覚的なシーンを理解する上で重要な部分です。ラベル付きインスタンスのロングテール分布は HOI 検出における主な課題であり、少数ショット学習とゼロショット学習の研究を促進しています。 HOI トリプレットの組み合わせの性質に触発され、一部の既存のアプローチでは、オブジェクトとアクションの特徴を個別に学習し、新しいトレーニング サンプルとして再構成する構成学習のアイデアを採用しています。ただし、これらの方法は、特徴抽出能力が制限された CNN ベースの 2 段階パラダイムに従い、多くの場合、パフォーマンスを向上させるために補助情報に依存します。追加情報を導入することなく、構成的 HOI 学習のためのトランスフォーマーベースのフレームワークを創造的に提案します。人間とオブジェクトのペア表現とインタラクション表現は、さまざまな HOI インスタンスにわたって再構成され、より豊富なコンテキスト情報が含まれ、知識の一般化が促進されます。実験では、私たちのシンプルだが効果的な方法が、特にまれな HOI クラスで最先端のパフォーマンスを達成することを示しています。
Human-object interaction (HOI) detection is an important part of understanding human activities and visual scenes. The long-tailed distribution of labeled instances is a primary challenge in HOI detection, promoting research in few-shot and zero-shot learning. Inspired by the combinatorial nature of HOI triplets, some existing approaches adopt the idea of compositional learning, in which object and action features are learned individually and re-composed as new training samples. However, these methods follow the CNN-based two-stage paradigm with limited feature extraction ability, and often rely on auxiliary information for better performance. Without introducing any additional information, we creatively propose a transformer-based framework for compositional HOI learning. Human-object pair representations and interaction representations are re-composed across different HOI instances, which involves richer contextual information and promotes the generalization of knowledge. Experiments show our simple but effective method achieves state-of-the-art performance, especially on rare HOI classes.
updated: Fri Aug 11 2023 06:41:20 GMT+0000 (UTC)
published: Fri Aug 11 2023 06:41:20 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト