arXiv reaDer
ビデオ監視におけるディープディテクタとシャムトラッカー間の相互作用について
On the Interaction Between Deep Detectors and Siamese Trackers in Video Surveillance
 視覚オブジェクト追跡は、人の位置特定や時空間認識など、多くのリアルタイムビデオ監視アプリケーションで重要な機能です。実際のアプリケーションでは、オブジェクト検出器とトラッカーは定期的に対話して新しいオブジェクトを検出し、それによってトラックを開始する必要があります。検出器との定期的なやり取りにより、トラッカーはオブジェクトテンプレートを検証および/または新しい境界ボックスで更新することもできます。ただし、トラッカーのドリフトを引き起こす可能性のある外観、背景、およびオクルージョンの変化により、最先端の検出器によって提供される境界ボックスはノイズが多くなります。さらに、CNNベースの検出器は計算の複雑さを犠牲にして高レベルの精度を提供できるため、リアルタイムアプリケーションでは相互作用を最小限に抑える必要があります。この論文では、Siamese-FCファミリーのトラッカーの検出器とトラッカーの相互作用を管理するための新しいアプローチを提案します。変更検出メカニズムをディープシャム-FCトラッカーに統合することにより、追跡中にドリフトを引き起こすターゲットの外観の変化に応じてそのテンプレートを適合させることができます。急激な変化の検出は、検出器によって生成されたバウンディングボックスを使用してトラッカーテンプレートの更新をトリガーしますが、緩やかな変化の場合、検出器は堅牢なマッチングのために進化するテンプレートセットを更新するために使用されます。ビデオ監視シナリオを模倣したOTB-100データセットのビデオのサブセットに対して、最先端のシャムFCトラッカーとYOLOv3検出器を使用して実験を実施しました。結果は、正確な検出器を使用する信頼できるVOTの重要性を強調しています。また、当社の適応型シャムトラッカーはノイズのあるオブジェクト検出に対して堅牢であり、シャムFC追跡のパフォーマンスを大幅に改善できることも示しています。
Visual object tracking is an important function in many real-time video surveillance applications, such as localization and spatio-temporal recognition of persons. In real-world applications, an object detector and tracker must interact on a periodic basis to discover new objects, and thereby to initiate tracks. Periodic interactions with the detector can also allow the tracker to validate and/or update its object template with new bounding boxes. However, bounding boxes provided by a state-of-the-art detector are noisy, due to changes in appearance, background and occlusion, which can cause the tracker to drift. Moreover, CNN-based detectors can provide a high level of accuracy at the expense of computational complexity, so interactions should be minimized for real-time applications. In this paper, a new approach is proposed to manage detector-tracker interactions for trackers from the Siamese-FC family. By integrating a change detection mechanism into a deep Siamese-FC tracker, its template can be adapted in response to changes in a target's appearance that lead to drifts during tracking. An abrupt change detection triggers an update of tracker template using the bounding box produced by the detector, while in the case of a gradual change, the detector is used to update an evolving set of templates for robust matching. Experiments were performed using state-of-the-art Siamese-FC trackers and the YOLOv3 detector on a subset of videos from the OTB-100 dataset that mimic video surveillance scenarios. Results highlight the importance for reliable VOT of using accurate detectors. They also indicate that our adaptive Siamese trackers are robust to noisy object detections, and can significantly improve the performance of Siamese-FC tracking.
updated: Thu Oct 31 2019 15:52:51 GMT+0000 (UTC)
published: Thu Oct 31 2019 15:52:51 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト