arXiv reaDer
単眼道路平面視差推定
Monocular Road Planar Parallax Estimation
運転可能な表面と周囲の環境の3D構造を推定することは、自動運転を支援するための重要なタスクです。これは通常、LiDARなどの高価な3Dセンサーを使用するか、ディープラーニングを介してポイントの深さを直接予測することで解決されます。既存の方法論に従う代わりに、平面視差に基づく単眼画像シーケンスからの3Dセンシング用の新しいディープニューラルネットワークであるRoad Planar Parallax Attention Network(RPANet)を提案します。これは、運転シーンで一般的に見られる路面形状を最大限に活用します。 RPANetは、道路面のホモグラフィによって位置合わせされた1対の画像を入力として受け取り、3D再構成用のγマップを出力します。深さまたは高さを推定するだけでなく、γマップは、深さまたは高さを簡単に導き出すことができる一方で、2つの連続するフレーム間で2次元変換を構築する可能性があります。道路面を基準として連続フレームをワープすることにより、平面視差と残差画像変位から3D構造を推定することができます。さらに、ネットワークが平面視差によって引き起こされる変位をよりよく認識できるようにするために、新しいクロスアテンションモジュールを導入します。 Waymo Open Datasetからデータをサンプリングし、平面視差に関連するデータを作成します。サンプリングされたデータセットに対して包括的な実験が行われ、困難なシナリオでのアプローチの3D再構成の精度が実証されます。
Estimating the 3D structure of the drivable surface and surrounding environment is a crucial task for assisted and autonomous driving. It is commonly solved either by using expensive 3D sensors such as LiDAR or directly predicting the depth of points via deep learning. Instead of following existing methodologies, we propose Road Planar Parallax Attention Network (RPANet), a new deep neural network for 3D sensing from monocular image sequences based on planar parallax, which takes full advantage of the commonly seen road plane geometry in driving scenes. RPANet takes a pair of images aligned by the homography of the road plane as input and outputs a γ map for 3D reconstruction. Beyond estimating the depth or height, the γ map has a potential to construct a two-dimensional transformation between two consecutive frames while can be easily derived to depth or height. By warping the consecutive frames using the road plane as a reference, the 3D structure can be estimated from the planar parallax and the residual image displacements. Furthermore, to make the network better perceive the displacements caused by planar parallax, we introduce a novel cross-attention module. We sample data from the Waymo Open Dataset and construct data related to planar parallax. Comprehensive experiments are conducted on the sampled dataset to demonstrate the 3D reconstruction accuracy of our approach in challenging scenarios.
updated: Mon Nov 22 2021 10:03:41 GMT+0000 (UTC)
published: Mon Nov 22 2021 10:03:41 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト