arXiv reaDer
DiffusionDepth: 単眼深度推定のための拡散ノイズ除去アプローチ
DiffusionDepth: Diffusion Denoising Approach for Monocular Depth Estimation
単眼深度推定は、単一の 2D 画像からピクセル単位の深度を予測する困難なタスクです。現在の方法では、通常、この問題を回帰または分類タスクとしてモデル化しています。単眼深度推定をノイズ除去拡散プロセスとして再定式化する新しいアプローチである DiffusionDepth を提案します。反復的なノイズ除去プロセスを学習し、単眼視条件のガイダンスを使用して、ランダムな深度分布を深度マップに「ノイズ除去」します。このプロセスは、専用の深度エンコーダーおよびデコーダーによってエンコードされた潜在空間で実行されます。モデルは、グラウンド トゥルース (GT) 深度を拡散する代わりに、それ自体の洗練された深度をランダムな深度分布に拡散するプロセスを逆にすることを学習します。この自己拡散定式化により、生成モデルをまばらな GT 深度シナリオに適用する難しさが克服されます。提案されたアプローチは、正確で非常に詳細な深度マップを生成するのに優れている深度推定を段階的に改良することにより、このタスクに利益をもたらします。 KITTI および NYU-Depth-V2 データセットに関する実験結果は、シンプルでありながら効率的な拡散アプローチが、屋内と屋外の両方のシナリオで、許容可能な推論時間で最先端のパフォーマンスに到達できることを示唆しています。
Monocular depth estimation is a challenging task that predicts the pixel-wise depth from a single 2D image. Current methods typically model this problem as a regression or classification task. We propose DiffusionDepth, a new approach that reformulates monocular depth estimation as a denoising diffusion process. It learns an iterative denoising process to `denoise' random depth distribution into a depth map with the guidance of monocular visual conditions. The process is performed in the latent space encoded by a dedicated depth encoder and decoder. Instead of diffusing ground truth (GT) depth, the model learns to reverse the process of diffusing the refined depth of itself into random depth distribution. This self-diffusion formulation overcomes the difficulty of applying generative models to sparse GT depth scenarios. The proposed approach benefits this task by refining depth estimation step by step, which is superior for generating accurate and highly detailed depth maps. Experimental results on KITTI and NYU-Depth-V2 datasets suggest that a simple yet efficient diffusion approach could reach state-of-the-art performance in both indoor and outdoor scenarios with acceptable inference time.
updated: Mon Mar 13 2023 06:18:14 GMT+0000 (UTC)
published: Thu Mar 09 2023 03:48:24 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト