arXiv reaDer
変圧器追跡のための一般化された関係モデリング
Generalized Relation Modeling for Transformer Tracking
以前の 2 ストリーム トラッカーと比較して、最近の 1 ストリーム トラッキング パイプラインは、テンプレートと検索領域の間のより早い相互作用を可能にし、顕著なパフォーマンスの向上を達成しました。ただし、既存の 1 ストリーム トラッカーでは、すべてのエンコーダー レイヤーを通じて、テンプレートが常に検索領域内のすべてのパーツと対話できます。これは、抽出された特徴表現が十分に識別できない場合、ターゲットと背景の混乱につながる可能性があります。この問題を軽減するために、適応トークン分割に基づく一般化された関係モデリング手法を提案します。提案された方法は、Transformer 追跡のための注意ベースの関係モデリングの一般化された定式化です。これは、テンプレート トークンと対話する適切な検索トークンを選択することにより、より柔軟な関係モデリングを可能にしながら、以前の 2 ストリーム パイプラインと 1 ストリーム パイプラインの両方の利点を継承します。トークン分割モジュールの並列計算とエンド ツー エンドの学習を容易にするために、アテンション マスキング戦略と Gumbel-Softmax 手法が導入されています。広範な実験により、私たちの方法が 2 ストリームおよび 1 ストリームのパイプラインよりも優れており、リアルタイムの実行速度で 6 つの困難なベンチマークで最先端のパフォーマンスを達成することが示されています。
Compared with previous two-stream trackers, the recent one-stream tracking pipeline, which allows earlier interaction between the template and search region, has achieved a remarkable performance gain. However, existing one-stream trackers always let the template interact with all parts inside the search region throughout all the encoder layers. This could potentially lead to target-background confusion when the extracted feature representations are not sufficiently discriminative. To alleviate this issue, we propose a generalized relation modeling method based on adaptive token division. The proposed method is a generalized formulation of attention-based relation modeling for Transformer tracking, which inherits the merits of both previous two-stream and one-stream pipelines whilst enabling more flexible relation modeling by selecting appropriate search tokens to interact with template tokens. An attention masking strategy and the Gumbel-Softmax technique are introduced to facilitate the parallel computation and end-to-end learning of the token division module. Extensive experiments show that our method is superior to the two-stream and one-stream pipelines and achieves state-of-the-art performance on six challenging benchmarks with a real-time running speed.
updated: Wed Mar 29 2023 10:29:25 GMT+0000 (UTC)
published: Wed Mar 29 2023 10:29:25 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト