デジタル サーフェス モデル (DSM) は、地球の表面を理解し、自然構造や人工構造の存在や変化を監視するための豊富な高さ情報を提供します。古典的な高さの推定には、マルチビューの地理空間画像または LiDAR 点群が必要ですが、取得に費用がかかる可能性があります。ニューラル ネットワーク ベースのモデルを使用した単一ビューの高さ推定は有望ですが、高解像度フィーチャの再構築には苦労する可能性があります。高解像度画像の合成と編集のための拡散モデルの最新の進歩は、リモート センシング画像、特に高さの推定にはまだ利用されていません。私たちのアプローチには、生成拡散モデルをトレーニングして、両方のドメインにわたる光学画像と DSM 画像の共同分布をマルコフ連鎖として学習することが含まれます。これは、現実的な高解像度 3D サーフェスを生成するためにソース画像を調整しながら、ノイズ除去スコア マッチングの目的を最小化することによって達成されます。この論文では、単一のリモート センシング画像から高さを推定するための条件付きノイズ除去拡散確率モデル (DDPM) を実験し、Vaihingen ベンチマーク データセットで有望な結果を示します。
Digital Surface Models (DSM) offer a wealth of height information for understanding the Earth's surface as well as monitoring the existence or change in natural and man-made structures. Classical height estimation requires multi-view geospatial imagery or LiDAR point clouds which can be expensive to acquire. Single-view height estimation using neural network based models shows promise however it can struggle with reconstructing high resolution features. The latest advancements in diffusion models for high resolution image synthesis and editing have yet to be utilized for remote sensing imagery, particularly height estimation. Our approach involves training a generative diffusion model to learn the joint distribution of optical and DSM images across both domains as a Markov chain. This is accomplished by minimizing a denoising score matching objective while being conditioned on the source image to generate realistic high resolution 3D surfaces. In this paper we experiment with conditional denoising diffusion probabilistic models (DDPM) for height estimation from a single remotely sensed image and show promising results on the Vaihingen benchmark dataset.