超高解像度(VHR)画像は、豊富な地面の詳細と空間的な幾何学的情報を提供できます。複数時間のVHR画像での変化の検出は、都市の拡大と地域の内部変化分析で重要な役割を果たします。それにもかかわらず、従来の変化検出方法は、空間コンテキスト情報を十分に活用することも、VHR画像の複雑な内部異質性に対処することもできません。この論文では、マルチスケールVHR画像の変化検出のために、マルチスケール特徴畳み込みユニット(MFCU)というタイトルの強力な特徴抽出モデルを採用しています。 MFCUは、同じレイヤーでマルチスケールの空間スペクトルフィーチャを抽出できます。ユニットに基づいて、ディープシャムマルチスケール畳み込みネットワーク(DSMS-CN)およびディープシャムマルチスケール完全畳み込みネットワーク(DSMS-FCN)と呼ばれる2つの新しいディープシャム畳み込みニューラルネットワークは、監視なしおよび監視ありの変更検出用に設計されています。それぞれ。監視なしの変更検出では、信頼できるトレーニングサンプルを取得するために自動事前分類が実装され、DSMS-CNは、MFCUモジュールとディープシャムアーキテクチャを通じて、選択されたトレーニングサンプルからの変更領域と未変更領域の統計分布に適合します。監視付き変更検出の場合、エンドツーエンドの深い完全たたみ込みネットワークDSMS-FCNは、任意のサイズの多時間VHR画像でトレーニングされ、バイナリ変更マップを直接出力します。さらに、不正確なローカリゼーションの問題を解決するために、完全に接続された条件付きランダムフィールド(FC-CRF)がDSMS-FCNと組み合わされて、結果が洗練されます。挑戦的なデータセットを用いた実験結果は、2つの提案されたアーキテクチャが最新の方法よりも優れていることを確認しています。
Very-high-resolution (VHR) images can provide abundant ground details and spatial geometric information. Change detection in multi-temporal VHR images plays a significant role in urban expansion and area internal change analysis. Nevertheless, traditional change detection methods can neither take full advantage of spatial context information nor cope with the complex internal heterogeneity of VHR images. In this paper, a powerful feature extraction model entitled multi-scale feature convolution unit (MFCU) is adopted for change detection in multi-temporal VHR images. MFCU can extract multi-scale spatial-spectral features in the same layer. Based on the unit two novel deep siamese convolutional neural networks, called as deep siamese multi-scale convolutional network (DSMS-CN) and deep siamese multi-scale fully convolutional network (DSMS-FCN), are designed for unsupervised and supervised change detection, respectively. For unsupervised change detection, an automatic pre-classification is implemented to obtain reliable training samples, then DSMS-CN fits the statistical distribution of changed and unchanged areas from selected training samples through MFCU modules and deep siamese architecture. For supervised change detection, the end-to-end deep fully convolutional network DSMS-FCN is trained in any size of multi-temporal VHR images, and directly outputs the binary change map. In addition, for the purpose of solving the inaccurate localization problem, the fully connected conditional random field (FC-CRF) is combined with DSMS-FCN to refine the results. The experimental results with challenging data sets confirm that the two proposed architectures perform better than the state-of-the-art methods.