arXiv reaDer
TCTrack:空中追跡の時間的コンテキスト
TCTrack: Temporal Contexts for Aerial Tracking
連続するフレーム間の時間的コンテキストは、既存のビジュアルトラッカーで完全に利用されるにはほど遠いです。この作業では、空中追跡のために時間的コンテキストを完全に活用するための包括的なフレームワークであるTCTrackを紹介します。時間的コンテキストは、特徴の抽出と類似性マップの改良という2つのレベルで組み込まれています。具体的には、特徴抽出のために、前のフレームに従って畳み込みの重みを動的に較正することによって達成される、時間情報を使用して空間的特徴を強化するためのオンライン時間適応畳み込みが提案される。類似性マップの改良のために、類似性マップの正確な調整のために時間的知識がデコードされる前に、最初にメモリ効率の良い方法で時間的知識を効果的にエンコードする適応型時間変換器を提案します。 TCTrackは効果的かつ効率的です。4つの空中追跡ベンチマークの評価は、その印象的なパフォーマンスを示しています。実際のUAVテストでは、NVIDIA Jetson AGXXavierで27FPSを超える高速性が示されています。
Temporal contexts among consecutive frames are far from being fully utilized in existing visual trackers. In this work, we present TCTrack, a comprehensive framework to fully exploit temporal contexts for aerial tracking. The temporal contexts are incorporated at two levels: the extraction of features and the refinement of similarity maps. Specifically, for feature extraction, an online temporally adaptive convolution is proposed to enhance the spatial features using temporal information, which is achieved by dynamically calibrating the convolution weights according to the previous frames. For similarity map refinement, we propose an adaptive temporal transformer, which first effectively encodes temporal knowledge in a memory-efficient way, before the temporal knowledge is decoded for accurate adjustment of the similarity map. TCTrack is effective and efficient: evaluation on four aerial tracking benchmarks shows its impressive performance; real-world UAV tests show its high speed of over 27 FPS on NVIDIA Jetson AGX Xavier.
updated: Mon Mar 28 2022 07:35:29 GMT+0000 (UTC)
published: Thu Mar 03 2022 18:04:20 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト