arXiv reaDer
Siamese Transformer Pyramid Networks for Real-Time UAV Tracking
最近のオブジェクト追跡方法は、深いネットワークまたは複雑なアーキテクチャに依存しています。これらのトラッカーのほとんどは、コンピューティングリソースが限られているモバイルプラットフォームでのリアルタイム処理要件をほとんど満たすことができません。この作業では、CNNとTransformerの両方のアーキテクチャの利点を継承するSiamese Transformer Pyramid Network(SiamTPN)を紹介します。具体的には、軽量ネットワーク(ShuffleNetV2)に固有の機能ピラミッドを活用し、Transformerで強化して、堅牢なターゲット固有の外観モデルを構築します。拡張された高レベルのフィーチャマップを構築するために、横方向のクロスアテンションを備えた集中型アーキテクチャが開発されています。ピラミッド表現をTransformerと融合する際の計算とメモリ強度を回避するために、さらに、ロバスト性を向上させながらメモリと時間の複雑さを大幅に軽減するプーリングアテンションモジュールを導入します。空中追跡ベンチマークと一般的な追跡ベンチマークの両方に関する包括的な実験により、高速で動作しながら競争力のある結果が得られ、SiamTPNの有効性が実証されています。さらに、当社の最速のバリアントトラッカーは、単一のCPUコアで30 Hz以上で動作し、LaSOTデータセットで58.1%のAUCスコアを取得します。ソースコードはで入手できます。
Recent object tracking methods depend upon deep networks or convoluted architectures. Most of those trackers can hardly meet real-time processing requirements on mobile platforms with limited computing resources. In this work, we introduce the Siamese Transformer Pyramid Network (SiamTPN), which inherits the advantages from both CNN and Transformer architectures. Specifically, we exploit the inherent feature pyramid of a lightweight network (ShuffleNetV2) and reinforce it with a Transformer to construct a robust target-specific appearance model. A centralized architecture with lateral cross attention is developed for building augmented high-level feature maps. To avoid the computation and memory intensity while fusing pyramid representations with the Transformer, we further introduce the pooling attention module, which significantly reduces memory and time complexity while improving the robustness. Comprehensive experiments on both aerial and prevalent tracking benchmarks achieve competitive results while operating at high speed, demonstrating the effectiveness of SiamTPN. Moreover, our fastest variant tracker operates over 30 Hz on a single CPU-core and obtaining an AUC score of 58.1% on the LaSOT dataset. Source codes are available at
updated: Sun Oct 17 2021 13:48:31 GMT+0000 (UTC)
published: Sun Oct 17 2021 13:48:31 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト