Deep Learning in Video Multi-Object Tracking: A Survey
 複数オブジェクト追跡(MOT)の問題は、シーケンス内のさまざまなオブジェクト(通常はビデオ)の軌跡を追跡することにあります。近年、ディープラーニングの登場により、この問題の解決策を提供するアルゴリズムは、ディープモデルの表現力の恩恵を受けています。このホワイトペーパーでは、ディープラーニングモデルを使用して、単一カメラビデオでのMOTのタスクを解決する作業に関する包括的な調査を提供します。 MOTアルゴリズムの4つの主要なステップが特定され、これらの各段階でディープラーニングがどのように採用されたかについての詳細なレビューが提示されます。 3つのMOTChallengeデータセットに関する提示された研究の完全な実験的比較も提供され、最高のパフォーマンスを発揮する方法間の多くの類似性を特定し、いくつかの可能な将来の研究の方向性を提示します。
The problem of Multiple Object Tracking (MOT) consists in following the trajectory of different objects in a sequence, usually a video. In recent years, with the rise of Deep Learning, the algorithms that provide a solution to this problem have benefited from the representational power of deep models. This paper provides a comprehensive survey on works that employ Deep Learning models to solve the task of MOT on single-camera videos. Four main steps in MOT algorithms are identified, and an in-depth review of how Deep Learning was employed in each one of these stages is presented. A complete experimental comparison of the presented works on the three MOTChallenge datasets is also provided, identifying a number of similarities among the top-performing methods and presenting some possible future research directions.
updated: Tue Nov 19 2019 11:26:20 GMT+0000 (UTC)
published: Thu Jul 18 2019 11:51:26 GMT+0000 (UTC)
