arXiv reaDer
リモートセンシング画像変化検出のための意味論的分離表現学習
Semantic decoupled representation learning for remote sensing image change detection
変化検出(CD)のデータ不足を軽減するための最新の転移学習ベースの方法は、主にImageNetの事前トレーニングに基づいています。自己監視学習(SSL)は、ドメイン内表現を学習するためのリモートセンシング(RS)に最近導入されました。ここでは、RS画像CDの意味分離表現学習を提案します。通常、関心のあるオブジェクト(建物など)は、広大な背景に比べて比較的小さいです。無関係な土地被覆によって支配される可能性のある1つの表現ベクトルに画像を表現する既存の方法とは異なり、セマンティックマスクを利用して、さまざまなセマンティック領域の表現を解きほぐします。さらに、モデルにさまざまなセマンティック表現を区別するように強制します。これにより、ダウンストリームCDタスクで対象のオブジェクトを認識することができます。事前トレーニングのために、セマンティックマスクを使用して両耳側性画像のデータセットを簡単に構築します。 2つのCDデータセットでの実験は、モデルがImageNet事前トレーニング、ドメイン内教師あり事前トレーニング、およびいくつかの最近のSSLメソッドよりも優れていることを示しています。
Contemporary transfer learning-based methods to alleviate the data insufficiency in change detection (CD) are mainly based on ImageNet pre-training. Self-supervised learning (SSL) has recently been introduced to remote sensing (RS) for learning in-domain representations. Here, we propose a semantic decoupled representation learning for RS image CD. Typically, the object of interest (e.g., building) is relatively small compared to the vast background. Different from existing methods expressing an image into one representation vector that may be dominated by irrelevant land-covers, we disentangle representations of different semantic regions by leveraging the semantic mask. We additionally force the model to distinguish different semantic representations, which benefits the recognition of objects of interest in the downstream CD task. We construct a dataset of bitemporal images with semantic masks in an effortless manner for pre-training. Experiments on two CD datasets show our model outperforms ImageNet pre-training, in-domain supervised pre-training, and several recent SSL methods.
updated: Sat Jan 15 2022 07:35:26 GMT+0000 (UTC)
published: Sat Jan 15 2022 07:35:26 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト