arXiv reaDer
差分特徴ガイド型 DDPM に基づく生成的変化検出モデル
A Generative Change Detection Model Based on Difference-Feature Guided DDPM
CNN や Transformer ネットワークなどの深層学習 (DL) アプローチは、バイタイムラル変化検出 (CD) において有望であることが示されています。ただし、これらのアプローチでは、長距離の依存関係をキャプチャし、2D 構造と空間的なローカル情報を組み込むには限界があり、その結果、エッジがはっきりとした不正確な CD マップが生成されます。これらの制限を克服するために、このホワイト ペーパーでは、変更認識拡散モデル (CADM) と呼ばれる新しいエンドツーエンド DDPM ベースのモデルを紹介します。このモデルでは、3 つの主要な革新が導入されています。まず、CADM は生成モデルとして CD マップを直接生成します。複雑な確率モデルを学習するための強力な手法である変分推論を利用して、モデルのデータ表現の段階的な学習と改良を促進します。これにより、CADM は、微妙で不規則な建物や自然の風景を背景から効果的に区別できるようになります。第 2 に、CADM は適応キャリブレーション条件付き差分エンコード技術を導入します。この手法では、マルチレベルの特徴間の違いを利用してサンプリング プロセスをガイドし、CD マップの精度を高めます。最後に、CADM にはノイズ抑制ベースのセマンティック エンハンサー (NSSE) が組み込まれており、CD マップの品質が向上します。 NSSE は、現在のステップでの事前知識を利用して高周波ノイズを抑制し、差分情報を強化して CD マップを洗練します。 CDD、WHU、レヴィエ、GVLM など、さまざまな地上シナリオを使用して 4 つのリモート センシング CD タスクで CADM を評価します。実験結果は、CADM が最先端の方法よりも大幅に優れていることを示し、提案されたモデルの一般化と有効性を示しています。
Deep learning (DL) approaches, such as CNN and Transformer networks, have shown promise in bitemporal change detection (CD). However, these approaches have limitations in capturing long-range dependencies and incorporating 2D structure and spatial local information, resulting in inaccurate CD maps with discerning edges. To overcome these limitations, this paper presents a novel end-to-end DDPM-based model called change-aware diffusion model (CADM), which introduces three key innovations. Firstly, CADM directly generates CD maps as a generation model. It leverages variational inference, a powerful technique for learning complex probabilistic models, to facilitate the gradual learning and refinement of the model's data representation. This enables CADM to effectively distinguish subtle and irregular buildings or natural scenes from the background. Secondly, CADM introduces an adaptive calibration conditional difference encoding technique. This technique utilizes differences between multi-level features to guide the sampling process, enhancing the precision of the CD map. Lastly, CADM incorporates a noise suppression-based semantic enhancer (NSSE) to improve the quality of the CD map. The NSSE utilizes prior knowledge from the current step to suppress high-frequency noise, enhancing the differential information and refining the CD map. We evaluate CADM on four remote sensing CD tasks with different ground scenarios, including CDD, WHU, Levier, and GVLM. Experimental results demonstrate that CADM significantly outperforms state-of-the-art methods, indicating the generalization and effectiveness of the proposed model.
updated: Sat Jun 17 2023 11:47:54 GMT+0000 (UTC)
published: Tue Jun 06 2023 05:51:50 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト