arXiv reaDer
Transformer Meets Tracker:ロバストなビジュアルトラッキングのための時間的コンテキストの活用
Transformer Meets Tracker: Exploiting Temporal Context for Robust Visual Tracking
ビデオオブジェクトトラッキングでは、既存のトラッカーではほとんど見過ごされてきた、連続するフレーム間に豊富な時間的コンテキストが存在します。この作業では、個々のビデオフレームをブリッジし、堅牢なオブジェクトトラッキングのために、トランスフォーマーアーキテクチャを介してそれら全体の時間的コンテキストを調査します。自然言語処理タスクでのトランスフォーマーの従来の使用法とは異なり、エンコーダーとデコーダーを2つの並列ブランチに分割し、シャムのような追跡パイプライン内で慎重に設計します。トランスフォーマーエンコーダーは、注意ベースの機能強化を介してターゲットテンプレートをプロモートします。これは、高品質の追跡モデル生成に役立ちます。トランスフォーマーデコーダーは、追跡キューを前のテンプレートから現在のフレームに伝播します。これにより、オブジェクトの検索プロセスが容易になります。私たちの変圧器支援追跡フレームワークはきちんとしていて、エンドツーエンドの方法で訓練されています。提案されたトランスフォーマーを使用すると、単純なシャムマッチングアプローチが現在の最高パフォーマンスのトラッカーよりも優れたパフォーマンスを発揮します。私たちのトランスフォーマーを最近の識別追跡パイプラインと組み合わせることにより、私たちの方法は、普及している追跡ベンチマークに関するいくつかの新しい最先端の記録を設定します。
In video object tracking, there exist rich temporal contexts among successive frames, which have been largely overlooked in existing trackers. In this work, we bridge the individual video frames and explore the temporal contexts across them via a transformer architecture for robust object tracking. Different from classic usage of the transformer in natural language processing tasks, we separate its encoder and decoder into two parallel branches and carefully design them within the Siamese-like tracking pipelines. The transformer encoder promotes the target templates via attention-based feature reinforcement, which benefits the high-quality tracking model generation. The transformer decoder propagates the tracking cues from previous templates to the current frame, which facilitates the object searching process. Our transformer-assisted tracking framework is neat and trained in an end-to-end manner. With the proposed transformer, a simple Siamese matching approach is able to outperform the current top-performing trackers. By combining our transformer with the recent discriminative tracking pipeline, our method sets several new state-of-the-art records on prevalent tracking benchmarks.
updated: Mon Mar 22 2021 09:20:05 GMT+0000 (UTC)
published: Mon Mar 22 2021 09:20:05 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト