arXiv reaDer
DORT: マルチカメラ 3D オブジェクトの検出と追跡のための Recurrent での動的オブジェクトのモデリング
DORT: Modeling Dynamic Objects in Recurrent for Multi-Camera 3D Object Detection and Tracking
最近のマルチカメラ 3D オブジェクト検出器は通常、時間情報を活用して、不適切な深度推定を軽減するマルチビュー ステレオを構築します。ただし、通常、すべてのオブジェクトが静的であり、フレーム全体で特徴を直接集約していると想定しています。この作業は、移動するオブジェクトの動きを無視すると深刻な位置特定バイアスが発生する可能性があることを明らかにするための理論的および経験的分析から始まります。したがって、この問題に取り組むために、動的オブジェクトを RecurrenT (DORT) でモデル化することを提案します。以前のグローバルな鳥瞰図 (BEV) メソッドとは対照的に、DORT はモーション推定のためにオブジェクト単位のローカル ボリュームを抽出し、重い計算負荷も軽減します。推定されたオブジェクトの動きと位置を繰り返し改良することにより、前の特徴を現在のフレームに正確に集約して、前述の悪影響を軽減することができます。シンプルなフレームワークには、2 つの重要な魅力的な特性があります。ほとんどのカメラベースの 3D オブジェクト検出器にプラグインできる柔軟性と実用性があります。ループにはオブジェクトの動きの予測があるため、最も近い中心距離に従って、フレーム全体でオブジェクトを簡単に追跡できます。付属品がなければ、DORT は nuScenes の検出と追跡のベンチマークで、それぞれ 62.5% の NDS と 57.6% の AMOTA で、以前のすべての方法よりも優れています。ソースコードが公開されます。
Recent multi-camera 3D object detectors usually leverage temporal information to construct multi-view stereo that alleviates the ill-posed depth estimation. However, they typically assume all the objects are static and directly aggregate features across frames. This work begins with a theoretical and empirical analysis to reveal that ignoring the motion of moving objects can result in serious localization bias. Therefore, we propose to model Dynamic Objects in RecurrenT (DORT) to tackle this problem. In contrast to previous global Bird-Eye-View (BEV) methods, DORT extracts object-wise local volumes for motion estimation that also alleviates the heavy computational burden. By iteratively refining the estimated object motion and location, the preceding features can be precisely aggregated to the current frame to mitigate the aforementioned adverse effects. The simple framework has two significant appealing properties. It is flexible and practical that can be plugged into most camera-based 3D object detectors. As there are predictions of object motion in the loop, it can easily track objects across frames according to their nearest center distances. Without bells and whistles, DORT outperforms all the previous methods on the nuScenes detection and tracking benchmarks with 62.5% NDS and 57.6% AMOTA, respectively. The source code will be released.
updated: Wed Apr 19 2023 01:58:41 GMT+0000 (UTC)
published: Wed Mar 29 2023 12:33:55 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト