arXiv reaDer
F2BEV: 全周魚眼カメラ画像からの自動運転用鳥瞰図生成
F2BEV: Bird's Eye View Generation from Surround-View Fisheye Camera Images for Automated Driving
鳥瞰図 (BEV) 表現は、知覚関連の自動運転タスクに非常に役立ちます。ただし、サラウンド ビューの魚眼カメラ画像から BEV を生成することは、このような広角レンズによって生じる強い歪みのために困難です。この課題に対処するための最初の一歩を踏み出し、魚眼画像から BEV 高さマップとセマンティック セグメンテーション マップを生成するためのベースライン F2BEV を導入します。 F2BEV は、トランスフォーマー スタイルのアーキテクチャで魚眼画像の特徴から空間情報を照会および統合するための、歪みを認識した空間相互注意モジュールと、それに続くタスク固有のヘッドで構成されます。合成 FB-SSEM データセットで F2BEV のシングルタスクおよびマルチタスク バリアントを評価します。これらはすべて、最先端の BEV 生成方法が動作するよりも優れた BEV 高さとセグメンテーション マップ (IoU に関して) を生成します。歪みのない魚眼画像。また、F2BEV を使用して、実世界の魚眼画像から高さマップを生成する方法も示します。データセットの最初のサンプルは、https://tinyurl.com/58jvnscy で公開されています。
Bird's Eye View (BEV) representations are tremendously useful for perception-related automated driving tasks. However, generating BEVs from surround-view fisheye camera images is challenging due to the strong distortions introduced by such wide-angle lenses. We take the first step in addressing this challenge and introduce a baseline, F2BEV, to generate BEV height maps and semantic segmentation maps from fisheye images. F2BEV consists of a distortion-aware spatial cross attention module for querying and consolidating spatial information from fisheye image features in a transformer-style architecture followed by a task-specific head. We evaluate single-task and multi-task variants of F2BEV on our synthetic FB-SSEM dataset, all of which generate better BEV height and segmentation maps (in terms of the IoU) than a state-of-the-art BEV generation method operating on undistorted fisheye images. We also demonstrate height map generation from real-world fisheye images using F2BEV. An initial sample of our dataset is publicly available at https://tinyurl.com/58jvnscy
updated: Tue Mar 07 2023 04:58:57 GMT+0000 (UTC)
published: Tue Mar 07 2023 04:58:57 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト