arXiv reaDer
2Dから3Dへ:単眼深度予測のベンチマークの再考
From 2D to 3D: Re-thinking Benchmarking of Monocular Depth Prediction
ベンチマークツールの同様に急速な進化と相まって、単眼深度予測(MDP)のための多くの最近提案された方法がありました。ただし、MDPは現在、ベンチマークの過剰適合を目撃しており、3Dアプリケーションの予測の有用性を評価するのに部分的にしか役立たないメトリックに依存していると主張します。これにより、2Dベースの距離を最適化するのではなく、シーンの3D構造を真に認識し、推定に向けて改善する新しい方法の設計と開発が制限されます。この作業では、3Dジオメトリの品質を評価するための評価指標の限界を示すことにより、本質的に3DタスクであるMDPに構造認識をもたらすことを目指しています。 MDPアプローチの3Dジオメトリを評価するのに適した一連のメトリックと、提案された評価方法に不可欠な新しい屋内ベンチマークRIO-D3Dを提案します。私たちのベンチマークは、RGB-D再構成から得られた高品質のレンダリングされた深度マップを特徴とする実際のデータセットに基づいています。さらに、これを示して、3Dシーンの完成という緊密に結びついたタスクのベンチマークを支援します。
There have been numerous recently proposed methods for monocular depth prediction (MDP) coupled with the equally rapid evolution of benchmarking tools. However, we argue that MDP is currently witnessing benchmark over-fitting and relying on metrics that are only partially helpful to gauge the usefulness of the predictions for 3D applications. This limits the design and development of novel methods that are truly aware of - and improving towards estimating - the 3D structure of the scene rather than optimizing 2D-based distances. In this work, we aim to bring structural awareness to MDP, an inherently 3D task, by exhibiting the limits of evaluation metrics towards assessing the quality of the 3D geometry. We propose a set of metrics well suited to evaluate the 3D geometry of MDP approaches and a novel indoor benchmark, RIO-D3D, crucial for the proposed evaluation methodology. Our benchmark is based on a real-world dataset featuring high-quality rendered depth maps obtained from RGB-D reconstructions. We further demonstrate this to help benchmark the closely-tied task of 3D scene completion.
updated: Tue Mar 15 2022 17:50:54 GMT+0000 (UTC)
published: Tue Mar 15 2022 17:50:54 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト