SCV-Stereo: Learning Stereo Matching from a Sparse Cost Volume
畳み込みニューラルネットワーク(CNN)ベースのステレオマッチングアプローチでは、一般に、視差の推定に高密度のコストボリューム(DCV)が必要です。ただし、このようなコストボリュームを生成すると、計算量とメモリを消費し、CNNトレーニングと推論の効率が低下します。この問題に対処するために、スパースコストボリューム(SCV)表現から高密度ステレオマッチングを学習できる新しいCNNアーキテクチャであるSCV-Stereoを提案します。私たちのインスピレーションは、DCV表現がいくらか冗長であり、SCV表現に置き換えることができるという事実に由来しています。これらのSCV表現の恩恵を受けて、当社のSCV-Stereoは、正確で効率的なステレオマッチングのために、視差推定を反復的に更新できます。 KITTIステレオベンチマークで実行された広範な実験は、SCV-Stereoがステレオマッチングの精度と効率の間のトレードオフを大幅に最小限に抑えることができることを示しています。私たちのプロジェクトページはです。
Convolutional neural network (CNN)-based stereo matching approaches generally require a dense cost volume (DCV) for disparity estimation. However, generating such cost volumes is computationally-intensive and memory-consuming, hindering CNN training and inference efficiency. To address this problem, we propose SCV-Stereo, a novel CNN architecture, capable of learning dense stereo matching from sparse cost volume (SCV) representations. Our inspiration is derived from the fact that DCV representations are somewhat redundant and can be replaced with SCV representations. Benefiting from these SCV representations, our SCV-Stereo can update disparity estimations in an iterative fashion for accurate and efficient stereo matching. Extensive experiments carried out on the KITTI Stereo benchmarks demonstrate that our SCV-Stereo can significantly minimize the trade-off between accuracy and efficiency for stereo matching. Our project page is
updated: Sat Jul 17 2021 05:45:44 GMT+0000 (UTC)
published: Sat Jul 17 2021 05:45:44 GMT+0000 (UTC)
