最近開発されたHypothizedand Independent Stochastic Population(HISP)フィルターに基づく新しいオンラインマルチターゲットビジュアルトラッカーを提案します。 HISPフィルターは、MHTなどの従来の追跡アプローチとPHDフィルターなどのポイントプロセスベースのアプローチの利点を組み合わせており、トラックのIDを維持しながら線形の複雑さを備えています。このフィルターを適用して、さまざまな環境条件下で取得されたビデオシーケンス内の複数のターゲットと、検出による追跡アプローチを使用したターゲット密度を追跡します。また、大規模な個人再識別データセットで検証識別ネットワーク(VerIdNet)をトレーニングすることにより、深いCNN外観表現を採用しています。この深いCNN外観機能と時空間情報を使用して、原理的な方法で拡張尤度を構築します。さらに、確認された各仮説で伝播された重みを考慮して、同じラベルを持つ2つ以上のターゲットの問題を解決します。 MOT16およびMOT17ベンチマークデータセットでの広範な実験は、追跡精度の点で、当社のトラッカーがいくつかの最先端のトラッカーを大幅に上回っていることを示しています。
We propose a novel online multi-target visual tracker based on the recently developed Hypothesized and Independent Stochastic Population (HISP) filter. The HISP filter combines advantages of traditional tracking approaches like MHT and point-process-based approaches like PHD filter, and it has linear complexity while maintaining track identities. We apply this filter for tracking multiple targets in video sequences acquired under varying environmental conditions and targets density using a tracking-by-detection approach. We also adopt deep CNN appearance representation by training a verification-identification network (VerIdNet) on large-scale person re-identification data sets. We construct an augmented likelihood in a principled manner using this deep CNN appearance features and spatio-temporal information. Furthermore, we solve the problem of two or more targets having identical label considering the weight propagated with each confirmed hypothesis. Extensive experiments on MOT16 and MOT17 benchmark data sets show that our tracker significantly outperforms several state-of-the-art trackers in terms of tracking accuracy.