arXiv reaDer
変化する環境でのセマンティック オブジェクトを使用したビュー不変ローカリゼーション
View-Invariant Localization using Semantic Objects in Changing Environments
この論文では、参照マップ内の車両のリアルタイムの位置特定とエゴモーション追跡のための新しいフレームワークを提案します。核となる考え方は、車両によって観測されたセマンティック オブジェクトをマッピングし、それらを参照マップ内の対応するオブジェクトに登録することです。最近のいくつかの研究では、クロスビュー ローカライゼーションにセマンティック情報が活用されていますが、この研究の主な貢献は、オブジェクトが検出可能な任意の視点構成にアプローチを直接適用できるビュー不変の定式化です。もう 1 つの際立った特徴は、極端な外れ値レジーム (例: 90% の関連付け外れ値) に適したデータ関連付けスキームによる、環境/オブジェクトの変化に対する堅牢性です。フレームワークを説明するために、車のみをオブジェクトとして使用して、参照オブジェクト マップで地上車両をローカライズする例を考えます。地上車両にはステレオ カメラのみが使用されますが、ステレオ カメラと Lidar スキャンを使用して地上の視点からアプリオリに構築されたリファレンス マップと、別の日にキャプチャされたジオリファレンスされた航空画像を考慮して、さまざまなモダリティ、視点、および環境の変化。 KITTI データセットでの評価では、3.7 km の軌道で位置特定が 36 秒で行われ、その後、Lidar リファレンス マップで平均位置誤差が 8.5 m のリアルタイム エゴモーション トラッキングが行われ、空中オブジェクト マップでは 77%のオブジェクトは異常値であり、ローカライゼーションは 71 秒で達成され、平均位置誤差は 7.9 m です。
This paper proposes a novel framework for real-time localization and egomotion tracking of a vehicle in a reference map. The core idea is to map the semantic objects observed by the vehicle and register them to their corresponding objects in the reference map. While several recent works have leveraged semantic information for cross-view localization, the main contribution of this work is a view-invariant formulation that makes the approach directly applicable to any viewpoint configuration for which objects are detectable. Another distinctive feature is robustness to changes in the environment/objects due to a data association scheme suited for extreme outlier regimes (e.g., 90% association outliers). To demonstrate our framework, we consider an example of localizing a ground vehicle in a reference object map using only cars as objects. While only a stereo camera is used for the ground vehicle, we consider reference maps constructed a priori from ground viewpoints using stereo cameras and Lidar scans, and georeferenced aerial images captured at a different date to demonstrate the framework's robustness to different modalities, viewpoints, and environment changes. Evaluations on the KITTI dataset show that over a 3.7 km trajectory, localization occurs in 36 sec and is followed by real-time egomotion tracking with an average position error of 8.5 m in a Lidar reference map, and on an aerial object map where 77% of objects are outliers, localization is achieved in 71 sec with an average position error of 7.9 m.
updated: Wed Sep 28 2022 21:26:38 GMT+0000 (UTC)
published: Wed Sep 28 2022 21:26:38 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト