arXiv reaDer
単眼道路平面視差推定
Monocular Road Planar Parallax Estimation
走行可能な路面と周囲環境の 3D 構造を推定することは、支援運転や自動運転にとって重要なタスクです。この問題は通常、LiDAR などの 3D センサーを使用するか、深層学習によってポイントの深さを直接予測することで解決されます。ただし、前者は高価であり、後者はシーンのジオメトリ情報を使用できません。この論文では、既存の方法論に従う代わりに、平面視差に基づく単眼画像シーケンスから 3D センシングのための新しいディープ ニューラル ネットワークである Road Planar Parallax Attendant Network (RPANet) を提案します。これは、運転中に遍在する道路平面の形状を最大限に活用します。シーン。 RPANet は、道路平面のホモグラフィーによって位置合わせされた 1 対の画像を入力として受け取り、3D 再構成用の γ マップ (高さと深さの比) を出力します。 γ マップには、2 つの連続するフレーム間の 2 次元変換を構築する可能性があります。これは平面視差を意味し、連続するフレームをワープすることで 3D 構造を推定するための基準として機能する道路平面と組み合わせることができます。さらに、平面視差によって引き起こされる変位をネットワークがより適切に認識できるようにする新しいクロスアテンション モジュールを導入します。私たちの方法の有効性を検証するために、Waymo Open Dataset からデータをサンプリングし、平面視差に関連するアノテーションを構築します。サンプリングされたデータセットに対して包括的な実験が行われ、困難なシナリオにおけるアプローチの 3D 再構成の精度が実証されます。
Estimating the 3D structure of the drivable surface and surrounding environment is a crucial task for assisted and autonomous driving. It is commonly solved either by using 3D sensors such as LiDAR or directly predicting the depth of points via deep learning. However, the former is expensive, and the latter lacks the use of geometry information for the scene. In this paper, instead of following existing methodologies, we propose Road Planar Parallax Attention Network (RPANet), a new deep neural network for 3D sensing from monocular image sequences based on planar parallax, which takes full advantage of the omnipresent road plane geometry in driving scenes. RPANet takes a pair of images aligned by the homography of the road plane as input and outputs a γ map (the ratio of height to depth) for 3D reconstruction. The γ map has the potential to construct a two-dimensional transformation between two consecutive frames. It implies planar parallax and can be combined with the road plane serving as a reference to estimate the 3D structure by warping the consecutive frames. Furthermore, we introduce a novel cross-attention module to make the network better perceive the displacements caused by planar parallax. To verify the effectiveness of our method, we sample data from the Waymo Open Dataset and construct annotations related to planar parallax. Comprehensive experiments are conducted on the sampled dataset to demonstrate the 3D reconstruction accuracy of our approach in challenging scenarios.
updated: Sun Jul 09 2023 18:38:07 GMT+0000 (UTC)
published: Mon Nov 22 2021 10:03:41 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト