RSI-CB: A Large Scale Remote Sensing Image Classification Benchmark via Crowdsource Data
 近年、ディープコンボリューショナルニューラルネットワーク(DCNN)は、DCNNを介した普遍的な近似能力、大規模なデータベース(ImageNetなど)、およびGPUを搭載したスーパーコンピューティング能力の3つの点により、自然な画像認識で画期的な進歩を遂げています。リモートセンシング分野には、ImageNetやPlace2と比較して大規模なベンチマークがまだありません。このホワイトペーパーでは、大規模でスケーラブルな多様なクラウドソースデータに基づくリモートセンシング画像分類ベンチマーク(RSI-CB)を提案します。 Open Street Map(OSM)データなどのクラウドソースデータを使用して、リモートセンシング画像の地上オブジェクトに、関心点、OSMからのベクトルデータ、またはその他のクラウドソースデータによる効果的な注釈を付けることができます。注釈付き画像は、リモートセンシング画像分類タスクで使用できます。この方法に基づいて、リモートセンシング画像分類の世界規模の大規模ベンチマークを構築します。このベンチマークには、DCNNごとに異なる画像サイズが必要なため、256 x 256および128 x 128のサイズの2つのサブデータセットがあります。前者には、24,000以上の画像の35のサブクラスを持つ6つのカテゴリが含まれています。後者には、36,000以上の画像の45のサブクラスを持つ6つのカテゴリが含まれています。この地上オブジェクトの分類システムは、中国の土地利用分類の国家標準に従って定義されており、ImageNetの階層メカニズムに触発されています。最後に、スケール不変特徴変換、色ヒストグラム、ローカルバイナリパターン、GISTなどの手作りの特徴について、RSI-CBとSAT-4、SAT-6、およびUC-Mercedデータセットを比較するために、多くの実験を行います。 AlexNet、VGGNet、GoogLeNet、ResNetなどのDCNNモデル。
In recent years, deep convolutional neural network (DCNN) has seen a breakthrough progress in natural image recognition because of three points: universal approximation ability via DCNN, large-scale database (such as ImageNet), and supercomputing ability powered by GPU. The remote sensing field is still lacking a large-scale benchmark compared to ImageNet and Place2. In this paper, we propose a remote sensing image classification benchmark (RSI-CB) based on massive, scalable, and diverse crowdsource data. Using crowdsource data, such as Open Street Map (OSM) data, ground objects in remote sensing images can be annotated effectively by points of interest, vector data from OSM, or other crowdsource data. The annotated images can be used in remote sensing image classification tasks. Based on this method, we construct a worldwide large-scale benchmark for remote sensing image classification. This benchmark has two sub-datasets with 256 by 256 and 128 by 128 sizes because different DCNNs require different image sizes. The former contains 6 categories with 35 subclasses of more than 24,000 images. The latter contains 6 categories with 45 subclasses of more than 36,000 images. This classification system of ground objects is defined according to the national standard of land-use classification in China and is inspired by the hierarchy mechanism of ImageNet. Finally, we conduct many experiments to compare RSI-CB with the SAT-4, SAT-6, and UC-Merced datasets on handcrafted features, such as scale-invariant feature transform, color histogram, local binary patterns, and GIST, and classical DCNN models, such as AlexNet, VGGNet, GoogLeNet, and ResNet.
