On the Importance of Stereo for Accurate Depth Estimation: An Efficient Semi-Supervised Deep Neural Network Approach
自動運転車両のコンテキストでの視覚的な深度推定の問題を再考します。近年の単眼深度推定の進歩にもかかわらず、自動運転が期待される車両による単眼カメラへの依存が広まっているため、単眼とステレオ深度の精度のギャップは依然として大きく、特に関連性のある結果であることを示しています。私たちは、単眼視の基本的な制限のために、このギャップを取り除くための課題は重要であると主張します。そのため、ステレオによる深度推定に重点を置いています。ディープステレオニューラルネットワークをトレーニングするための新しい半教師あり学習アプローチと、機械学習されたargmaxレイヤーとカスタムランタイム(パブリックに共有される)を含む新しいアーキテクチャを提案します。組み込みGPUで実行します。比較結果は、KITTI 2015ステレオデータセットに表示されます。また、さまざまな設計基準の精度への影響を測定することにより、ステレオアルゴリズムの最近の進歩を評価します。
We revisit the problem of visual depth estimation in the context of autonomous vehicles. Despite the progress on monocular depth estimation in recent years, we show that the gap between monocular and stereo depth accuracy remains large-a particularly relevant result due to the prevalent reliance upon monocular cameras by vehicles that are expected to be self-driving. We argue that the challenges of removing this gap are significant, owing to fundamental limitations of monocular vision. As a result, we focus our efforts on depth estimation by stereo. We propose a novel semi-supervised learning approach to training a deep stereo neural network, along with a novel architecture containing a machine-learned argmax layer and a custom runtime (that will be shared publicly) that enables a smaller version of our stereo DNN to run on an embedded GPU. Competitive results are shown on the KITTI 2015 stereo dataset. We also evaluate the recent progress of stereo algorithms by measuring the impact upon accuracy of various design criteria.
updated: Wed Jul 08 2020 02:14:14 GMT+0000 (UTC)
published: Mon Mar 26 2018 17:19:40 GMT+0000 (UTC)
