arXiv reaDer
CroMo:単眼深度推定のためのクロスモーダル学習
CroMo: Cross-Modal Learning for Monocular Depth Estimation
学習ベースの深度推定は、複数の方向で最近の進歩を目撃しています。単眼ビデオを使用した自己監視から、最高の精度を提供する監視ありの方法まで。監視を補完するものとして、複数の信号からの情報を組み合わせることにより、パフォーマンスと堅牢性がさらに向上します。このホワイトペーパーでは、センサーとモダリティの設計の選択に関連する主要なトレードオフと、関連するモデルトレーニング戦略を体系的に調査します。私たちの研究は、偏光、飛行時間、構造化光入力からのモダリティ固有の利点を結び付けることができる新しい方法につながります。単眼偏光から深度を推定できる新しいパイプラインを提案し、さまざまなトレーニング信号を評価します。これにより、微分可能な分析モデルの反転により、シーンジオメトリが偏光およびToF信号に接続され、自己監視型のクロスモーダル学習が可能になります。既存のマルチモーダルデータセットがない場合は、カスタムメイドのマルチモーダルカメラリグを使用してアプローチを検討し、CroMoを収集します。ビデオレートでキャプチャされた、同期ステレオ偏光、間接ToF、構造化光深度で構成される最初のデータセット。挑戦的なビデオシーンでの広範な実験により、定性的および定量的なパイプラインの利点の両方が確認され、競争力のある単眼深度推定方法を上回ることができます。
Learning-based depth estimation has witnessed recent progress in multiple directions; from self-supervision using monocular video to supervised methods offering highest accuracy. Complementary to supervision, further boosts to performance and robustness are gained by combining information from multiple signals. In this paper we systematically investigate key trade-offs associated with sensor and modality design choices as well as related model training strategies. Our study leads us to a new method, capable of connecting modality-specific advantages from polarisation, Time-of-Flight and structured-light inputs. We propose a novel pipeline capable of estimating depth from monocular polarisation for which we evaluate various training signals. The inversion of differentiable analytic models thereby connects scene geometry with polarisation and ToF signals and enables self-supervised and cross-modal learning. In the absence of existing multimodal datasets, we examine our approach with a custom-made multi-modal camera rig and collect CroMo; the first dataset to consist of synchronized stereo polarisation, indirect ToF and structured-light depth, captured at video rates. Extensive experiments on challenging video scenes confirm both qualitative and quantitative pipeline advantages where we are able to outperform competitive monocular depth estimation method.
updated: Wed Mar 23 2022 15:25:31 GMT+0000 (UTC)
published: Wed Mar 23 2022 15:25:31 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト