arXiv reaDer
RVMDE:ロボット工学のためのレーダー検証済み単眼深度推定
RVMDE: Radar Validated Monocular Depth Estimation for Robotics
立体視は、シーン内の距離の自然な知覚を明らかにし、3D世界理解におけるその表現は直感的な現象です。ただし、正確な深度推定には、両眼視センサーの本質的な厳密なキャリブレーションが不可欠です。あるいは、単眼カメラは深度を推定する際の精度を犠牲にして制限を緩和し、過酷な環境条件では課題が悪化します。さらに、光センサーは過酷な環境ではバイタル信号を取得できないことが多く、代わりにレーダーが使用されます。これにより、粗いがより正確な信号が得られます。この作業では、過酷な環境条件での深度推定のために、単眼カメラからのきめ細かいデータと融合した場合のレーダーからの粗い信号の有用性を探ります。特徴ピラミッドネットワーク(FPN)の変形は、パラメーターの数が少ない複数のスケールで、きめの細かい画像特徴を広範囲に操作します。 FPN特徴マップは、畳み込みニューラルネットワークで抽出されたスパースレーダー特徴と融合されます。連結された階層的特徴は、順序回帰で深さを予測するために使用されます。 nuScenesデータセットで実験を実行しましたが、提案されたアーキテクチャは、パラメータを減らして推論を高速化する定量的評価でトップを維持しています。深度推定の結果は、提案された手法が、ロボット工学や自動運転車の重要なアプリケーションでステレオ深度推定の代替として使用できることを示唆しています。ソースコードは次の場所で入手できます:https://github.com/MI-Hussain/RVMDE。
Stereoscopy exposits a natural perception of distance in a scene, and its manifestation in 3D world understanding is an intuitive phenomenon. However, an innate rigid calibration of binocular vision sensors is crucial for accurate depth estimation. Alternatively, a monocular camera alleviates the limitation at the expense of accuracy in estimating depth, and the challenge exacerbates in harsh environmental conditions. Moreover, an optical sensor often fails to acquire vital signals in harsh environments, and radar is used instead, which gives coarse but more accurate signals. This work explores the utility of coarse signals from radar when fused with fine-grained data from a monocular camera for depth estimation in harsh environmental conditions. A variant of feature pyramid network (FPN) extensively operates on fine-grained image features at multiple scales with a fewer number of parameters. FPN feature maps are fused with sparse radar features extracted with a Convolutional neural network. The concatenated hierarchical features are used to predict the depth with ordinal regression. We performed experiments on the nuScenes dataset, and the proposed architecture stays on top in quantitative evaluations with reduced parameters and faster inference. The depth estimation results suggest that the proposed techniques can be used as an alternative to stereo depth estimation in critical applications in robotics and self-driving cars. The source code will be available in the following: https://github.com/MI-Hussain/RVMDE.
updated: Sat Sep 11 2021 12:02:29 GMT+0000 (UTC)
published: Sat Sep 11 2021 12:02:29 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト