arXiv reaDer
Alpha-Refine:正確なバウンディングボックス推定による追跡パフォーマンスの向上
Alpha-Refine: Boosting Tracking Performance by Precise Bounding Box Estimation
ビジュアルオブジェクトトラッキングは、特定のターゲットのバウンディングボックスを正確に推定することを目的としています。これは、変形やオクルージョンなどの要因による困難な問題です。最近の多くのトラッカーは、バウンディングボックス推定の品質を向上させるために多段階追跡戦略を採用しています。これらの方法では、最初にターゲットを大まかに特定し、次の段階で初期予測を調整します。ただし、既存のアプローチは依然として精度に制限があり、異なるステージの結合により、メソッドの転送可能性が大幅に制限されます。この作品は、ベーストラッカーの予測品質を大幅に向上させることができるAlpha-Refineと呼ばれる斬新で柔軟かつ正確な改良モジュールを提案します。一連の設計オプションを検討することにより、洗練を成功させる鍵は、可能な限り詳細な空間情報を抽出して維持することであると結論付けます。この原理に従って、Alpha-Refineは、ピクセル単位の相関、コーナー予測ヘッド、および補助マスクヘッドをコアコンポーネントとして採用しています。 Alpha-Refineを6つの有名なベーストラッカーに適用して、メソッドの有効性を検証します。DiMPsuper、DiMP50、ATOM、SiamRPN ++、RT-MDNet、およびECOです。 TrackingNet、LaSOT、GOT-10K、およびVOT2020ベンチマークでの包括的な実験は、私たちのアプローチがわずかな追加の待ち時間でベーストラッカーのパフォーマンスを大幅に改善することを示しています。コードと事前トレーニング済みモデルは、https://github.com/MasterBin-IIAU/AlphaRefineで入手できます。
Visual object tracking aims to precisely estimate the bounding box for the given target, which is a challenging problem due to factors such as deformation and occlusion. Many recent trackers adopt the multiple-stage tracking strategy to improve the quality of bounding box estimation. These methods first coarsely locate the target and then refine the initial prediction in the following stages. However, existing approaches still suffer from limited precision, and the coupling of different stages severely restricts the method's transferability. This work proposes a novel, flexible, and accurate refinement module called Alpha-Refine, which can significantly improve the base trackers' prediction quality. By exploring a series of design options, we conclude that the key to successful refinement is extracting and maintaining detailed spatial information as much as possible. Following this principle, Alpha-Refine adopts a pixel-wise correlation, a corner prediction head, and an auxiliary mask head as the core components. We apply Alpha-Refine to six famous base trackers to verify our method's effectiveness: DiMPsuper, DiMP50, ATOM, SiamRPN++, RT-MDNet, and ECO. Comprehensive experiments on TrackingNet, LaSOT, GOT-10K, and VOT2020 benchmarks show that our approach significantly improves the base tracker's performance with little extra latency. Code and pretrained model is available at https://github.com/MasterBin-IIAU/AlphaRefine.
updated: Sat Dec 12 2020 13:33:25 GMT+0000 (UTC)
published: Sat Dec 12 2020 13:33:25 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト