arXiv reaDer
視覚オブジェクト追跡のための連続性識別畳み込みニューラルネットワーク
Continuity-Discrimination Convolutional Neural Network for Visual Object Tracking
この論文は、視覚的物体追跡のための、連続性識別畳み込みニューラルネットワーク(CD-CNN)と名付けられた新しいモデルを提案します。既存の最先端の追跡方法は、ビデオシーケンスの時間的関係を処理しないため、不完全な特徴表現につながります。この問題に対処するために、CD-CNNは、時間的遅延の概念に基づいて時間的外観の連続性をモデル化します。数学的には、追跡に時間的外観の連続性を導入することにより、ターゲットの外観表現エラーの上限を高い確率で十分に小さくできることを証明します。さらに、不正確なターゲットのローカリゼーションとドリフトを軽減するために、オブジェクト性だけでなく、特定のパッチ内のターゲットの相対位置も特徴付ける新しい概念、オブジェクト重心を提案します。時間的外観の連続性とオブジェクト重心の両方がオフライントレーニング中に共同で学習され、オンライン追跡のために転送されます。 2つの挑戦的なベンチマークでの広範な実験を通じてトラッカーを評価し、最先端のトラッカーと比較して競争力のある追跡パフォーマンスを示します。
This paper proposes a novel model, named Continuity-Discrimination Convolutional Neural Network (CD-CNN), for visual object tracking. Existing state-of-the-art tracking methods do not deal with temporal relationship in video sequences, which leads to imperfect feature representations. To address this problem, CD-CNN models temporal appearance continuity based on the idea of temporal slowness. Mathematically, we prove that, by introducing temporal appearance continuity into tracking, the upper bound of target appearance representation error can be sufficiently small with high probability. Further, in order to alleviate inaccurate target localization and drifting, we propose a novel notion, object-centroid, to characterize not only objectness but also the relative position of the target within a given patch. Both temporal appearance continuity and object-centroid are jointly learned during offline training and then transferred for online tracking. We evaluate our tracker through extensive experiments on two challenging benchmarks and show its competitive tracking performance compared with state-of-the-art trackers.
updated: Sun Apr 18 2021 06:35:03 GMT+0000 (UTC)
published: Sun Apr 18 2021 06:35:03 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト