arXiv reaDer
InterTrack: 3D マルチオブジェクト トラッキング用の相互作用トランスフォーマー
InterTrack: Interaction Transformer for 3D Multi-Object Tracking
3D マルチオブジェクト トラッキング (MOT) は、自動運転車にとって重要な問題であり、動的な環境で十分な情報に基づいたモーション プランニングを実行するために必要です。特に密集したシーンでは、既存のシステムが重要なコンテキスト情報を省略する傾向があるため、既存のトラックを新しい検出に関連付けることは依然として困難です。私たちが提案するソリューションである InterTrack は、3D MOT 用の Interaction Transformer を導入して、データ関連付けのための識別可能なオブジェクト表現を生成します。追跡と検出ごとに状態と形状の特徴を抽出し、注意によってグローバル情報を効率的に集約します。次に、追跡/検出機能の各ペアに対して学習回帰を実行して親和性を推定し、堅牢な 2 段階のデータ関連付けと追跡管理アプローチを使用して最終的な追跡を生成します。 nuScenes 3D MOT ベンチマークでアプローチを検証し、特に物理サイズが小さくクラスター化されたオブジェクトを持つクラスで、大幅な改善が見られます。提出時点で、InterTrack は CenterPoint 検出を使用する方法の中で AMOTA 全体で 1 位にランクされています。
3D multi-object tracking (MOT) is a key problem for autonomous vehicles, required to perform well-informed motion planning in dynamic environments. Particularly for densely occupied scenes, associating existing tracks to new detections remains challenging as existing systems tend to omit critical contextual information. Our proposed solution, InterTrack, introduces the Interaction Transformer for 3D MOT to generate discriminative object representations for data association. We extract state and shape features for each track and detection, and efficiently aggregate global information via attention. We then perform a learned regression on each track/detection feature pair to estimate affinities, and use a robust two-stage data association and track management approach to produce the final tracks. We validate our approach on the nuScenes 3D MOT benchmark, where we observe significant improvements, particularly on classes with small physical sizes and clustered objects. As of submission, InterTrack ranks 1st in overall AMOTA among methods using CenterPoint detections.
updated: Wed Aug 17 2022 03:24:36 GMT+0000 (UTC)
published: Wed Aug 17 2022 03:24:36 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト