arXiv reaDer
長距離ステレオマッチングにおけるバイアスの調整:セマンティクスに基づくアプローチ
Adjusting Bias in Long Range Stereo Matching: A semantics guided approach
立体視は一般に、ピクセル対応の計算と、修正された画像ペア間の視差の推定を伴います。同時ローカリゼーションおよびマッピング(SLAM)や3Dオブジェクト検出を含む多くのアプリケーションでは、視差は主に深度値を計算するために必要であり、深度推定の精度は視差推定よりも説得力があることがよくあります。ただし、視差推定の精度は、特に遠くのオブジェクトの場合、深度推定の精度に直接変換されません。学習ベースのステレオシステムのコンテキストでは、これは主に、視差ベースの損失関数とトレーニングデータの選択によって課せられるバイアスによるものです。その結果、学習アルゴリズムは、特に長距離〜(> 50m)で、前景オブジェクトの信頼性の低い深度推定値を生成することがよくあります。この問題を解決するために、最初にこれらのバイアスの影響を分析し、次に前景と背景の新しい深度ベースの損失関数のペアを別々に提案します。これらの損失関数は調整可能であり、ステレオ学習アルゴリズムの固有のバイアスのバランスをとることができます。私たちのソリューションの有効性は、最先端技術に対してベンチマークされた広範な一連の実験によって実証されています。 KITTI〜2015ベンチマークで、提案されたソリューションにより、特に50メートルを超える距離にあるオブジェクトの視差と深度の推定が大幅に改善され、以前の最先端技術を10%上回っていることを示します。
Stereo vision generally involves the computation of pixel correspondences and estimation of disparities between rectified image pairs. In many applications, including simultaneous localization and mapping (SLAM) and 3D object detection, the disparities are primarily needed to calculate depth values and the accuracy of depth estimation is often more compelling than disparity estimation. The accuracy of disparity estimation, however, does not directly translate to the accuracy of depth estimation, especially for faraway objects. In the context of learning-based stereo systems, this is largely due to biases imposed by the choices of the disparity-based loss function and the training data. Consequently, the learning algorithms often produce unreliable depth estimates of foreground objects, particularly at large distances~(>50m). To resolve this issue, we first analyze the effect of those biases and then propose a pair of novel depth-based loss functions for foreground and background, separately. These loss functions are tunable and can balance the inherent bias of the stereo learning algorithms. The efficacy of our solution is demonstrated by an extensive set of experiments, which are benchmarked against state of the art. We show on KITTI~2015 benchmark that our proposed solution yields substantial improvements in disparity and depth estimation, particularly for objects located at distances beyond 50 meters, outperforming the previous state of the art by 10%.
updated: Tue Nov 10 2020 01:30:54 GMT+0000 (UTC)
published: Thu Sep 10 2020 01:47:53 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト