arXiv reaDer
ピクセルレベルでの自己監視リモートセンシング画像変化検出
Self-supervised Remote Sensing Images Change Detection at Pixel-level
ディープラーニング技術は、リモートセンシング画像の変化の検出で大きな成功を収めています。それらのほとんどは教師あり手法であり、通常は大量のトレーニングデータを必要とし、特定のアプリケーションに限定されます。教師なしアプローチとしての自己監視法は、この問題を解決するために広く使用されており、教師なしバイナリ変更検出タスクで広く使用されています。ただし、変更検出の既存の自己監視方式は、事前タスクまたはパッチレベルに基づいており、ピクセル単位の変更検出タスクには最適ではない可能性があります。したがって、この作業では、この制限を克服するために、ピクセル単位の対照的なアプローチが提案されています。これは、ラベルのないマルチビュー設定でピクセルレベルの機能の対照的な損失を使用することによって実現されます。このアプローチでは、シャムResUnetは、ピクセル単位の表現を取得し、シフトされた正のペアから特徴を整列するようにトレーニングされます。一方、ベクトル量子化は、2つのブランチで学習された特徴を補強するために使用されます。最終的なバイナリ変更マップは、一方のブランチの特徴をもう一方のブランチの特徴から差し引き、Rosinしきい値法を使用して取得されます。バイナリ変更マップの定期的な季節変化の影響を克服するために、提案されたアプローチの時間的ロバスト性を強化するために不確実性手法も使用しました。 2つの同種(OSCDおよびMUDS)データセットと1つの異種(カリフォルニア洪水)データセットを使用して、提案されたアプローチのパフォーマンスを評価します。結果は、パッチごとのマルチビュー対照法よりも効率と精度の両方が向上していることを示しています。
Deep learning techniques have achieved great success in remote sensing image change detection. Most of them are supervised techniques, which usually require large amounts of training data and are limited to a particular application. Self-supervised methods as an unsupervised approach are popularly used to solve this problem and are widely used in unsupervised binary change detection tasks. However, the existing self-supervised methods in change detection are based on pre-tasks or at patch-level, which may be sub-optimal for pixel-wise change detection tasks. Therefore, in this work, a pixel-wise contrastive approach is proposed to overcome this limitation. This is achieved by using contrastive loss in pixel-level features on an unlabeled multi-view setting. In this approach, a Siamese ResUnet is trained to obtain pixel-wise representations and to align features from shifted positive pairs. Meanwhile, vector quantization is used to augment the learned features in two branches. The final binary change map is obtained by subtracting features of one branch from features of the other branch and using the Rosin thresholding method. To overcome the effects of regular seasonal changes in binary change maps, we also used an uncertainty method to enhance the temporal robustness of the proposed approach. Two homogeneous (OSCD and MUDS) datasets and one heterogeneous (California Flood) dataset are used to evaluate the performance of the proposed approach. Results demonstrate improvements in both efficiency and accuracy over the patch-wise multi-view contrastive method.
updated: Fri Oct 08 2021 15:27:14 GMT+0000 (UTC)
published: Tue May 18 2021 13:28:46 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト