arXiv reaDer
Adaptive Unimodal Cost Volume Filtering for Deep Stereo Matching
 最新のディープラーニングベースのステレオマッチングアプローチでは、視差推定を回帰問題として扱います。この場合、損失関数は真の視差とその推定視差に直接定義されます。ただし、視差はコストボリュームによってモデル化されたマッチングプロセスの副産物にすぎませんが、視差の回帰によって駆動されるコストボリュームを間接的に学習することは、コストボリュームが制約されているため過剰適合しがちです。本論文では、真の不均衡をピークとする単峰分布でコストボリュームをフィルタリングすることにより、コストボリュームに制約を直接追加することを提案します。さらに、各ピクセルの単峰性分布の分散を推定して、異なるコンテキストでのマッチングの不確実性を明示的にモデル化します。提案されたアーキテクチャは、シーンフローと2つのKITTIステレオベンチマークで最先端のパフォーマンスを実現します。特に、私たちの方法は、KITTI 2012評価の1位とKITTI 2015評価の4位(2019.8.20に記録)をランク付けしました。 AcfNetのコードは、で入手できます。
State-of-the-art deep learning based stereo matching approaches treat disparity estimation as a regression problem, where loss function is directly defined on true disparities and their estimated ones. However, disparity is just a byproduct of a matching process modeled by cost volume, while indirectly learning cost volume driven by disparity regression is prone to overfitting since the cost volume is under constrained. In this paper, we propose to directly add constraints to the cost volume by filtering cost volume with unimodal distribution peaked at true disparities. In addition, variances of the unimodal distributions for each pixel are estimated to explicitly model matching uncertainty under different contexts. The proposed architecture achieves state-of-the-art performance on Scene Flow and two KITTI stereo benchmarks. In particular, our method ranked the 1^st place of KITTI 2012 evaluation and the 4^th place of KITTI 2015 evaluation (recorded on 2019.8.20). The codes of AcfNet are available at:
updated: Tue Nov 19 2019 13:44:15 GMT+0000 (UTC)
published: Mon Sep 09 2019 10:45:20 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト