arXiv reaDer
対照的なマルチビューコーディングを使用したリモートセンシングシーン表現の自己教師あり学習
Self-Supervised Learning of Remote Sensing Scene Representations Using Contrastive Multiview Coding
近年、教師あり学習は、教師なし表現学習の有望な候補として浮上しています。視覚領域では、そのアプリケーションは主に自然のシーンの画像のコンテキストで研究されています。ただし、その適用性は、リモートセンシングや医療など、大量のラベル付きデータを取得することが難しい特定の分野で特に興味深いものです。この作業では、リモートセンシング画像分類における自己教師あり学習の適用可能性の広範な分析を行います。自己教師あり事前トレーニングに使用される画像の数とドメインが、ダウンストリームタスクのパフォーマンスに与える影響を分析します。リモートセンシング画像分類のダウンストリームタスクでは、リモートセンシング画像に教師あり事前トレーニングを使用すると、自然シーンの画像に教師あり事前トレーニングを使用するよりも良い結果が得られることを示します。さらに、自己教師あり事前トレーニングをマルチスペクトル画像に簡単に拡張して、ダウンストリームタスクでさらに優れた結果を生成できることも示しています。
In recent years self-supervised learning has emerged as a promising candidate for unsupervised representation learning. In the visual domain its applications are mostly studied in the context of images of natural scenes. However, its applicability is especially interesting in specific areas, like remote sensing and medicine, where it is hard to obtain huge amounts of labeled data. In this work, we conduct an extensive analysis of the applicability of self-supervised learning in remote sensing image classification. We analyze the influence of the number and domain of images used for self-supervised pre-training on the performance on downstream tasks. We show that, for the downstream task of remote sensing image classification, using self-supervised pre-training on remote sensing images can give better results than using supervised pre-training on images of natural scenes. Besides, we also show that self-supervised pre-training can be easily extended to multispectral images producing even better results on our downstream tasks.
updated: Thu Jun 03 2021 17:59:23 GMT+0000 (UTC)
published: Wed Apr 14 2021 18:25:43 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト