arXiv reaDer
CNNベースの再識別を備えたGM-PHDフィルターを使用したオクルージョン-ロバストなオンラインマルチオブジェクトビジュアルトラッキング
Occlusion-Robust Online Multi-Object Visual Tracking using a GM-PHD Filter with CNN-Based Re-Identification
ガウス混合確率仮説密度(GM-PHD)フィルターと深い畳み込みニューラルネットワーク(CNN)の外観表現学習を使用した、検出による追跡パラダイムを介した新しいオンラインマルチオブジェクト視覚追跡アルゴリズムを提案します。 GM-PHDフィルターは、シーン内の未知の時間変化するオブジェクトの数の状態とカーディナリティを推定しながら、オブジェクトと観測の数に線形の複雑さを持っています。統一されたフレームワークでオブジェクトの誕生、死、混乱を処理しますが、誤検出の影響を受けやすく、オブジェクトのIDは含まれていません。オブジェクトの境界ボックスと深く学習された外観表現から取得した視覚的時空間情報を使用して、各ターゲットのラベル付けのための推定と追跡データの関連付けを実行し、拡張尤度を定式化して、GM-の更新ステップに統合します。 PHDフィルター。大規模な個人再識別データセットで識別ネットワーク(IdNet)をトレーニングすることにより、深いCNN外観表現を学習します。また、オクルージョンによって引き起こされる誤検出に対するGM-PHDフィルターの感受性を克服するために、データ関連付けステップの後に追加の未割り当てトラック予測を採用しています。リアルタイムで実行される当社のトラッカーは、さまざまな環境条件とオブジェクト密度の下で取得されたビデオシーケンス内の複数のオブジェクトを追跡するために適用されます。最後に、Multiple Object Tracking 2016(MOT16)および2017(MOT17)ベンチマークデータセットについて広範な評価を行い、追跡の精度と識別の点で、オンライントラッカーがいくつかの最先端のトラッカーよりも大幅に優れていることを確認しました。
We propose a novel online multi-object visual tracking algorithm via a tracking-by-detection paradigm using a Gaussian mixture Probability Hypothesis Density (GM-PHD) filter and deep Convolutional Neural Network (CNN) appearance representations learning. The GM-PHD filter has a linear complexity with the number of objects and observations while estimating the states and cardinality of unknown and time-varying number of objects in the scene. Though it handles object birth, death and clutter in a unified framework, it is susceptible to miss-detections and does not include the identity of objects. We use visual-spatio-temporal information obtained from object bounding boxes and deeply learned appearance representations to perform estimates-to-tracks data association for labeling of each target as well as formulate an augmented likelihood and then integrate into the update step of the GM-PHD filter. We learn the deep CNN appearance representations by training an identification network (IdNet) on large-scale person re-identification data sets. We also employ additional unassigned tracks prediction after the data association step to overcome the susceptibility of the GM-PHD filter towards miss-detections caused by occlusion. Our tracker which runs in real-time is applied to track multiple objects in video sequences acquired under varying environmental conditions and objects density. Lastly, we make extensive evaluations on Multiple Object Tracking 2016 (MOT16) and 2017 (MOT17) benchmark data sets and find out that our online tracker significantly outperforms several state-of-the-art trackers in terms of tracking accuracy and identification.
updated: Mon Nov 09 2020 16:19:20 GMT+0000 (UTC)
published: Tue Dec 10 2019 20:18:42 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト