arXiv reaDer
見えない人の検出
Detecting Invisible People
単眼の物体検出と追跡は近年劇的に改善されましたが、物体がカメラに見えるという重要な仮定に依存しています。多くのオフライン追跡アプローチは、オブジェクトが再表示された後にトラックレットをリンクし、再識別(ReID)を利用することにより、事後的に閉塞されたオブジェクトについて推論します。ただし、具体化されたロボットエージェント(自動運転車など)でのオンライン追跡には、基本的にオブジェクトの永続性が必要です。これは、オブジェクトが再表示される前に、閉塞されたオブジェクトについて推論する機能です。この作業では、追跡ベンチマークを再利用し、人々の実例に焦点を当てて、目に見えないオブジェクトを検出するタスクの新しいメトリックを提案します。現在の検出および追跡システムは、このタスクで劇的にパフォーマンスが低下することを示しています。このパフォーマンス低下の多くを回復するために、2つの重要なイノベーションを紹介します。時間的シーケンスでの閉塞オブジェクト検出を短期的な予測の課題として扱い、動的なシーケンス予測からツールを提供します。次に、最先端の単眼深度推定ネットワークによって生成された観測を利用して、3Dで明示的に推論する動的モデルを構築します。私たちの知る限り、私たちの作品は、遮蔽されたオブジェクトを追跡および検出するタスクに対する単眼深度推定の有効性を実証する最初の作業です。私たちのアプローチは、アブレーションのベースラインを11.4%超え、F1スコアの最先端を5.0%上回っています。
Monocular object detection and tracking have improved drastically in recent years, but rely on a key assumption: that objects are visible to the camera. Many offline tracking approaches reason about occluded objects post-hoc, by linking together tracklets after the object re-appears, making use of reidentification (ReID). However, online tracking in embodied robotic agents (such as a self-driving vehicle) fundamentally requires object permanence, which is the ability to reason about occluded objects before they re-appear. In this work, we re-purpose tracking benchmarks and propose new metrics for the task of detecting invisible objects, focusing on the illustrative case of people. We demonstrate that current detection and tracking systems perform dramatically worse on this task. We introduce two key innovations to recover much of this performance drop. We treat occluded object detection in temporal sequences as a short-term forecasting challenge, bringing to bear tools from dynamic sequence prediction. Second, we build dynamic models that explicitly reason in 3D, making use of observations produced by state-of-the-art monocular depth estimation networks. To our knowledge, ours is the first work to demonstrate the effectiveness of monocular depth estimation for the task of tracking and detecting occluded objects. Our approach strongly improves by 11.4% over the baseline in ablations and by 5.0% over the state-of-the-art in F1 score.
updated: Tue Dec 15 2020 16:54:45 GMT+0000 (UTC)
published: Tue Dec 15 2020 16:54:45 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト