Depth Completion from Sparse LiDAR Data with Depth-Normal Constraints
  深度補完は、まばらな深度測定から密な深度マップを回復することを目的としています。自動運転の重要性が増しており、ビジョンコミュニティからの注目が高まっています。既存の方法のほとんどは、ネットワークを直接訓練して、疎な深度入力から密な深度マップへのマッピングを学習しますが、3D幾何学的制約を利用し、実用的なセンサーノイズを処理するのは困難です。この論文では、深さ補完を正規化し、ノイズに対するロバスト性を改善するために、1)拡散モジュールの深さと表面法線の間の幾何学的制約をモデル化し、2)緩和するためのスパースLiDAR測定の信頼性を予測する統一CNNフレームワークを提案しますノイズの影響。具体的には、エンコーダーデコーダーバックボーンは、表面の法線、粗い深さ、およびLiDAR入力の信頼度を同時に予測します。これらは、その後、最終的な結果を得るために拡散調整モジュールに入力されます。 KITTI深度補完データセットとNYU-Depth-V2データセットに関する広範な実験により、この方法が最先端のパフォーマンスを達成することが実証されています。さらなるアブレーションの研究と分析により、提案された方法についてより多くの洞察が得られ、モデルの一般化能力と安定性が実証されます。
Depth completion aims to recover dense depth maps from sparse depth measurements. It is of increasing importance for autonomous driving and draws increasing attention from the vision community. Most of existing methods directly train a network to learn a mapping from sparse depth inputs to dense depth maps, which has difficulties in utilizing the 3D geometric constraints and handling the practical sensor noises. In this paper, to regularize the depth completion and improve the robustness against noise, we propose a unified CNN framework that 1) models the geometric constraints between depth and surface normal in a diffusion module and 2) predicts the confidence of sparse LiDAR measurements to mitigate the impact of noise. Specifically, our encoder-decoder backbone predicts surface normals, coarse depth and confidence of LiDAR inputs simultaneously, which are subsequently inputted into our diffusion refinement module to obtain the final completion results. Extensive experiments on KITTI depth completion dataset and NYU-Depth-V2 dataset demonstrate that our method achieves state-of-the-art performance. Further ablation study and analysis give more insights into the proposed method and demonstrate the generalization capability and stability of our model.
