arXiv reaDer
新規の単項ペアワイズトランスを使用した人間と物体の相互作用の効率的な2段階検出
Efficient Two-Stage Detection of Human-Object Interactions with a Novel Unary-Pairwise Transformer
ビジュアルデータのトランスフォーマーモデルの最近の開発により、認識および検出タスクが大幅に改善されました。特に、地域提案の代わりに学習可能なクエリを使用することで、Detection Transformer(DETR)が主導する新しいクラスの1ステージ検出モデルが生まれました。この1段階のアプローチのバリエーションは、それ以来、人間と物体の相互作用(HOI)の検出を支配してきました。ただし、このような1ステージHOI検出器の成功は、主に変圧器の表現力に起因する可能性があります。同じトランスフォーマーを装備した場合、2ステージのトランスフォーマーは、トレーニングにかかる時間のほんの一部でありながら、パフォーマンスとメモリ効率が向上する可能性があることを発見しました。この作業では、HOIの単項表現とペアワイズ表現を活用する2ステージ検出器である単項ペアワイズトランスフォーマーを提案します。トランスネットワークの単項部分とペアワイズ部分が特殊であり、前者は優先的に肯定的な例のスコアを増やし、後者は否定的な例のスコアを減らします。 HICO-DETおよびV-COCOデータセットでこの方法を評価し、最先端のアプローチを大幅に上回っています。推論時に、ResNet50を使用したモデルは、単一のGPUでのリアルタイムパフォーマンスに近づきます。
Recent developments in transformer models for visual data have led to significant improvements in recognition and detection tasks. In particular, using learnable queries in place of region proposals has given rise to a new class of one-stage detection models, spearheaded by the Detection Transformer (DETR). Variations on this one-stage approach have since dominated human-object interaction (HOI) detection. However, the success of such one-stage HOI detectors can largely be attributed to the representation power of transformers. We discovered that when equipped with the same transformer, their two-stage counterparts can be more performant and memory-efficient, while taking a fraction of the time to train. In this work, we propose the Unary-Pairwise Transformer, a two-stage detector that exploits unary and pairwise representations for HOIs. We observe that the unary and pairwise parts of our transformer network specialise, with the former preferentially increasing the scores of positive examples and the latter decreasing the scores of negative examples. We evaluate our method on the HICO-DET and V-COCO datasets, and significantly outperform state-of-the-art approaches. At inference time, our model with ResNet50 approaches real-time performance on a single GPU.
updated: Fri Dec 03 2021 10:52:06 GMT+0000 (UTC)
published: Fri Dec 03 2021 10:52:06 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト