arXiv reaDer
SiamRCR: Reciprocal Classification and Regression for Visual Object Tracking
最近、ほとんどのシャムネットワークベースのトラッカーは、オブジェクト分類とバウンディングボックス回帰を介してターゲットを特定します。一般に、最終的な予測として、分類の信頼度が最大のバウンディングボックスを選択します。この戦略では、分類と回帰の間の精度の不整合により、正しい結果が得られない可能性があります。この論文では、SiamRCRと呼ばれる新しいシャム追跡アルゴリズムを提案し、シンプルで軽量かつ効果的なソリューションでこの問題に対処します。分類ブランチと回帰ブランチの間に相互リンクを構築し、陽性サンプルごとに損失を動的に再重み付けできます。さらに、ローカリゼーションブランチを追加してローカリゼーションの精度を予測し、推論中に回帰支援リンクの代わりとして機能できるようにします。このブランチにより、トレーニングと推論の一貫性が高まります。広範な実験結果は、SiamRCRの有効性と、GOT-10k、LaSOT、TrackingNet、OTB-2015、VOT-2018、およびVOT-2019における最先端の競合他社に対するその優位性を示しています。さらに、SiamRCRは65 FPSで動作し、リアルタイムの要件をはるかに上回っています。
Recently, most siamese network based trackers locate targets via object classification and bounding-box regression. Generally, they select the bounding-box with maximum classification confidence as the final prediction. This strategy may miss the right result due to the accuracy misalignment between classification and regression. In this paper, we propose a novel siamese tracking algorithm called SiamRCR, addressing this problem with a simple, light and effective solution. It builds reciprocal links between classification and regression branches, which can dynamically re-weight their losses for each positive sample. In addition, we add a localization branch to predict the localization accuracy, so that it can work as the replacement of the regression assistance link during inference. This branch makes the training and inference more consistent. Extensive experimental results demonstrate the effectiveness of SiamRCR and its superiority over the state-of-the-art competitors on GOT-10k, LaSOT, TrackingNet, OTB-2015, VOT-2018 and VOT-2019. Moreover, our SiamRCR runs at 65 FPS, far above the real-time requirement.
updated: Mon May 24 2021 12:21:25 GMT+0000 (UTC)
published: Mon May 24 2021 12:21:25 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト