arXiv reaDer
マッチングを学ぶ:ビジュアルトラッキングのための自動マッチングネットワーク設計
Learn to Match: Automatic Matching Network Design for Visual Tracking
シャム追跡は、近年、画期的なパフォーマンスを達成しました。その本質は、効率的なマッチング演算子の相互相関とその変形です。目覚ましい成功に加えて、ヒューリスティックマッチングネットワークの設計は専門家の経験に大きく依存していることに注意することが重要です。さらに、実験的に、1つのマッチング演算子だけで、すべての困難な環境で安定した追跡を保証することは困難であることがわかりました。したがって、この作業では、明示的な類似性学習の代わりに、特徴融合の観点から6つの新しいマッチング演算子、つまり連結、点ごとの加算、ペアごとの関係、FiLM、単純なトランスフォーマー、およびトランスダクティブガイダンスを紹介し、一致する演算子の選択。分析により、さまざまな環境劣化タイプに対するこれらのオペレーターの選択的な適応性が明らかになり、補完的な機能を探索するためにそれらを組み合わせるように促されます。この目的のために、これらの演算子の最適な組み合わせを検索するためのバイナリチャネル操作(BCM)を提案します。 BCMは、他の追跡ステップへの寄与を学習することにより、1人のオペレーターを再トレーニングまたは破棄することを決定します。学習したマッチングネットワークを強力なベースライントラッカーOceanに挿入することにより、モデルはOTB100、LaSOT、およびTrackingNetでそれぞれ67.2→71.4、52.6→58.3、70.3→76.0の成功によって有利なゲインを達成します。特に、AutoMatchと呼ばれる当社のトラッカーは、ベースライントラッカーの半分未満のトレーニングデータ/時間を使用し、PyTorchを使用して50FPSで実行されます。コードとモデルはhttps://github.com/JudasDie/SOTSでリリースされます。
Siamese tracking has achieved groundbreaking performance in recent years, where the essence is the efficient matching operator cross-correlation and its variants. Besides the remarkable success, it is important to note that the heuristic matching network design relies heavily on expert experience. Moreover, we experimentally find that one sole matching operator is difficult to guarantee stable tracking in all challenging environments. Thus, in this work, we introduce six novel matching operators from the perspective of feature fusion instead of explicit similarity learning, namely Concatenation, Pointwise-Addition, Pairwise-Relation, FiLM, Simple-Transformer and Transductive-Guidance, to explore more feasibility on matching operator selection. The analyses reveal these operators' selective adaptability on different environment degradation types, which inspires us to combine them to explore complementary features. To this end, we propose binary channel manipulation (BCM) to search for the optimal combination of these operators. BCM determines to retrain or discard one operator by learning its contribution to other tracking steps. By inserting the learned matching networks to a strong baseline tracker Ocean, our model achieves favorable gains by 67.2 →71.4, 52.6 →58.3, 70.3 →76.0 success on OTB100, LaSOT, and TrackingNet, respectively. Notably, Our tracker, dubbed AutoMatch, uses less than half of training data/time than the baseline tracker, and runs at 50 FPS using PyTorch. Code and model will be released at https://github.com/JudasDie/SOTS.
updated: Mon Aug 02 2021 12:09:23 GMT+0000 (UTC)
published: Mon Aug 02 2021 12:09:23 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト