arXiv reaDer
視覚オブジェクトトラッキングのためのピラミッド相関ベースのディープハフ投票
Pyramid Correlation based Deep Hough Voting for Visual Object Tracking
既存のシャムベースのトラッカーのほとんどは、追跡問題を分類と回帰の並行タスクとして扱います。ただし、一部の研究では、兄弟の頭の構造がネットワークトレーニング中に最適ではないソリューションにつながる可能性があることが示されています。実験を通じて、トレーニングの目的に合わせてネットワークを繊細に設計する限り、回帰がなければ、パフォーマンスは同様に有望であることがわかりました。ターゲットの左上隅と右下隅を共同で見つけるために、ピラミッド相関ベースのディープハフ投票(PCDHVの略)という名前の新しい投票ベースの分類のみの追跡アルゴリズムを紹介します。具体的には、ピラミッド相関モジュールを革新的に構築して、埋め込まれた機能にきめ細かいローカル構造とグローバル空間コンテキストを装備します。精巧に設計されたDeepHough Votingモジュールがさらに引き継ぎ、ピクセルの長距離依存性を統合してコーナーを認識します。さらに、一般的な離散化ギャップは、チャネルと空間の関係を活用しながら、フィーチャマップの空間解像度を上げることにより、単純かつ効果的に緩和されます。アルゴリズムは一般的で、堅牢でシンプルです。一連のアブレーション実験を通じて、モジュールの有効性を示します。私たちのトラッカーは、ベルやホイッスルなしで、80 FPSのリアルタイム速度で実行しながら、3つの挑戦的なベンチマーク(TrackingNet、GOT-10k、LaSOT)でSOTAアルゴリズムよりも優れたまたは同等のパフォーマンスを実現します。コードとモデルがリリースされます。
Most of the existing Siamese-based trackers treat tracking problem as a parallel task of classification and regression. However, some studies show that the sibling head structure could lead to suboptimal solutions during the network training. Through experiments we find that, without regression, the performance could be equally promising as long as we delicately design the network to suit the training objective. We introduce a novel voting-based classification-only tracking algorithm named Pyramid Correlation based Deep Hough Voting (short for PCDHV), to jointly locate the top-left and bottom-right corners of the target. Specifically we innovatively construct a Pyramid Correlation module to equip the embedded feature with fine-grained local structures and global spatial contexts; The elaborately designed Deep Hough Voting module further take over, integrating long-range dependencies of pixels to perceive corners; In addition, the prevalent discretization gap is simply yet effectively alleviated by increasing the spatial resolution of the feature maps while exploiting channel-space relationships. The algorithm is general, robust and simple. We demonstrate the effectiveness of the module through a series of ablation experiments. Without bells and whistles, our tracker achieves better or comparable performance to the SOTA algorithms on three challenging benchmarks (TrackingNet, GOT-10k and LaSOT) while running at a real-time speed of 80 FPS. Codes and models will be released.
updated: Fri Oct 15 2021 10:37:00 GMT+0000 (UTC)
published: Fri Oct 15 2021 10:37:00 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト