変化検出(CD)は、さまざまな時間にキャプチャされた画像ペア内の変化領域を検出することを目的としており、さまざまな実世界のアプリケーションで重要な役割を果たします。それにもかかわらず、既存の作業のほとんどは、機能の違いの品質の影響を無視しながら、機能の違いを最終的な変更マップにマップする高度なネットワークアーキテクチャの設計に焦点を合わせています。この論文では、CDを新しい観点、つまり、特徴の違いを最適化して変化を強調し、変更されていない領域を抑制する方法を研究し、反復差分拡張トランスフォーマー(IDET)と呼ばれる新しいモジュールを提案します。 IDETには、3つのトランスフォーマーが含まれています。2つの画像の長距離情報を抽出するための2つのトランスフォーマーと、機能の違いを強調するための1つのトランスフォーマーです。以前のトランスとは対照的に、3番目のトランスは最初の2つのトランスの出力を取得して、機能の違いの強化を繰り返しガイドします。より効果的なリファインメントを実現するために、複数の特徴の違いのリファインメントに画像のマルチスケール表現を使用するマルチスケールIDETベースの変化検出をさらに提案し、すべてのリファインメントを組み合わせるための粗い融合戦略を提案します。最終的なCDメソッドは、さまざまなアプリケーションシナリオで6つの大規模データセットで7つの最先端のメソッドを上回ります。これは、機能の違いを強化することの重要性とIDETの有効性を示しています。
Change detection (CD) aims to detect change regions within an image pair captured at different times, playing a significant role for diverse real-world applications. Nevertheless, most of existing works focus on designing advanced network architectures to map the feature difference to the final change map while ignoring the influence of the quality of the feature difference. In this paper, we study the CD from a new perspective, i.e., how to optimize the feature difference to highlight changes and suppress unchanged regions, and propose a novel module denoted as iterative difference-enhanced transformers (IDET). IDET contains three transformers: two transformers for extracting the long-range information of the two images and one transformer for enhancing the feature difference. In contrast to the previous transformers, the third transformer takes the outputs of the first two transformers to guide the enhancement of the feature difference iteratively. To achieve more effective refinement, we further propose the multi-scale IDET-based change detection that uses multi-scale representations of the images for multiple feature difference refinements and proposes a coarse-to-fine fusion strategy to combine all refinements. Our final CD method outperforms seven state-of-the-art methods on six large-scale datasets under diverse application scenarios, which demonstrates the importance of feature difference enhancements and the effectiveness of IDET.