Active Learning for Improved Semi-Supervised Semantic Segmentation in Satellite Images
リモートセンシングデータは、森林火災や森林破壊の監視から都市化の追跡に至るまでのアプリケーションにとって重要です。これらのタスクのほとんどは、これらの衛星画像で利用可能な限られたラベル付きデータから視覚情報を解析するために、モデルに高密度のピクセルレベルの注釈を必要とします。この領域では高品質のラベル付きトレーニングデータが不足しているため、半教師あり手法に焦点を当てる必要があります。これらの手法は、ラベル付けされたトレーニングセットを補強するために使用される、ラベル付けされた例の小さなセットから疑似ラベルを生成します。このため、非常に代表的で多様なラベル付きトレーニングセットが必要になります。したがって、アクティブラーニングベースのサンプリング戦略を使用して、ラベル付けされたトレーニングデータの非常に代表的なセットを選択することを提案します。衛星画像を含む2つの既存のセマンティックセグメンテーションデータセット(UC Merced Land Use ClassificationDatasetとDeepGlobeLand Cover Classification Dataset)に対する提案された方法の有効性を示します。ラベル付きトレーニングデータの小さなセットをランダムにサンプリングするよりも、アクティブラーニングサンプリング戦略を使用して、わずか2%のラベル付きデータでmIoUが27%向上したことを報告します。
Remote sensing data is crucial for applications ranging from monitoring forest fires and deforestation to tracking urbanization. Most of these tasks require dense pixel-level annotations for the model to parse visual information from limited labeled data available for these satellite images. Due to the dearth of high-quality labeled training data in this domain, there is a need to focus on semi-supervised techniques. These techniques generate pseudo-labels from a small set of labeled examples which are used to augment the labeled training set. This makes it necessary to have a highly representative and diverse labeled training set. Therefore, we propose to use an active learning-based sampling strategy to select a highly representative set of labeled training data. We demonstrate our proposed method's effectiveness on two existing semantic segmentation datasets containing satellite images: UC Merced Land Use Classification Dataset and DeepGlobe Land Cover Classification Dataset. We report a 27% improvement in mIoU with as little as 2% labeled data using active learning sampling strategies over randomly sampling the small set of labeled training data.
updated: Fri Oct 15 2021 00:29:31 GMT+0000 (UTC)
published: Fri Oct 15 2021 00:29:31 GMT+0000 (UTC)
