arXiv reaDer
異なる解像度の画像用のスタックアテンションモジュールを備えた超解像ベースの変化検出ネットワーク
Super-resolution-based Change Detection Network with Stacked Attention Module for Images with Different Resolutions
一時的な画像に基づいて表面の変化を区別することを目的とした変化の検出は、生態学的保護と都市計画において重要な役割を果たします。通常、高解像度(HR)画像は時間の経過とともに継続的に取得できないため、実際のアプリケーションでの変化検出には、解像度の異なるバイテンポラル画像が採用されることがよくあります。異なる解像度の画像を使用して変化を検出するための従来のサブピクセルベースの方法は、HR画像が使用される場合に実質的なエラーの蓄積につながる可能性があります。これは、クラス内の不均一性とクラス間の類似性によるものです。したがって、HR画像により適した、異なる解像度の画像を使用した変化検出の新しい方法を開発する必要があります。この目的のために、我々は、スタックされた注意モジュールを備えた超解像ベースの変化検出ネットワーク(SRCDNet)を提案します。 SRCDNetは、ジェネレーターとディスクリミネーターを含む超解像(SR)モジュールを使用して、敵対的学習を通じてSR画像を直接学習し、バイテンポラル画像間の解像度の違いを克服します。マルチスケール特徴の有用な情報を強化するために、5つの畳み込みブロック注意モジュール(CBAM)で構成されるスタック注意モジュールが特徴抽出器に統合されています。最終的な変更マップは、メトリック学習ベースの変更決定モジュールを介して取得されます。このモジュールでは、バイテンポラルフィーチャ間の距離マップが計算されます。実験結果は、提案された方法の優位性を示しています。これは、すべてのベースラインを上回っているだけでなく、建物の変化検出データセットで87.40%、変化検出データセットで92.94%の最高のF1スコアを示しているだけでなく、実行された実験で最高の精度も得ています。 4倍と8倍の解像度の違いがある画像で。 SRCDNetのソースコードはhttps://github.com/liumency/SRCDNetで入手できます。
Change detection, which aims to distinguish surface changes based on bi-temporal images, plays a vital role in ecological protection and urban planning. Since high resolution (HR) images cannot be typically acquired continuously over time, bi-temporal images with different resolutions are often adopted for change detection in practical applications. Traditional subpixel-based methods for change detection using images with different resolutions may lead to substantial error accumulation when HR images are employed; this is because of intraclass heterogeneity and interclass similarity. Therefore, it is necessary to develop a novel method for change detection using images with different resolutions, that is more suitable for HR images. To this end, we propose a super-resolution-based change detection network (SRCDNet) with a stacked attention module. The SRCDNet employs a super resolution (SR) module containing a generator and a discriminator to directly learn SR images through adversarial learning and overcome the resolution difference between bi-temporal images. To enhance the useful information in multi-scale features, a stacked attention module consisting of five convolutional block attention modules (CBAMs) is integrated to the feature extractor. The final change map is obtained through a metric learning-based change decision module, wherein a distance map between bi-temporal features is calculated. The experimental results demonstrate the superiority of the proposed method, which not only outperforms all baselines -with the highest F1 scores of 87.40% on the building change detection dataset and 92.94% on the change detection dataset -but also obtains the best accuracies on experiments performed with images having a 4x and 8x resolution difference. The source code of SRCDNet will be available at https://github.com/liumency/SRCDNet.
updated: Sat Feb 27 2021 11:17:40 GMT+0000 (UTC)
published: Sat Feb 27 2021 11:17:40 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト