このホワイトペーパーでは、マルチモーダルマルチラベルリモートセンシング(RS)での深層学習(DL)研究をサポートするために、Sentinel-1およびSentinel-2画像パッチの590,326ペアで構成されるマルチモーダルBigEarthNet(BigEarthNet-MM)ベンチマークアーカイブを紹介します。 )画像の取得と分類。 BigEarthNet-MMのパッチの各ペアには、テーマ的に最も詳細なレベル3クラスの命名法に基づいて、2018年のCORINE Land Cover(CLC)マップによって提供されるマルチラベルの注釈が付けられています。私たちの最初の調査では、一部のCLCクラスは、(単一の日付の)BigEarthNet-MM画像のみを考慮して正確に記述することが難しいことが示されています。このホワイトペーパーでは、この問題に対処するための元のCLCラベルの進化形として、代替のクラス命名法も紹介します。これは、BigEarthNet-MM画像のプロパティに基づいてCLCレベル3の命名法を解釈し、19クラスの新しい命名法に配置することによって実現されます。私たちの実験では、いくつかの最先端のDLモデルを検討することにより、マルチモーダルマルチラベル画像検索および分類問題に対するBigEarthNet-MMの可能性を示します。また、BigEarthNet-MMでゼロからトレーニングされたDLモデルは、特に農業やその他の植生および自然環境を含むいくつかの複雑なクラスに関して、ImageNetで事前にトレーニングされたモデルよりも優れていることを示します。すべてのデータとDLモデルをhttps://bigearth.netで公開し、RSでのマルチモーダル画像シーンの分類と検索の問題に関する研究をサポートするための重要なリソースを提供します。
This paper presents the multi-modal BigEarthNet (BigEarthNet-MM) benchmark archive made up of 590,326 pairs of Sentinel-1 and Sentinel-2 image patches to support the deep learning (DL) studies in multi-modal multi-label remote sensing (RS) image retrieval and classification. Each pair of patches in BigEarthNet-MM is annotated with multi-labels provided by the CORINE Land Cover (CLC) map of 2018 based on its thematically most detailed Level-3 class nomenclature. Our initial research demonstrates that some CLC classes are challenging to be accurately described by only considering (single-date) BigEarthNet-MM images. In this paper, we also introduce an alternative class-nomenclature as an evolution of the original CLC labels to address this problem. This is achieved by interpreting and arranging the CLC Level-3 nomenclature based on the properties of BigEarthNet-MM images in a new nomenclature of 19 classes. In our experiments, we show the potential of BigEarthNet-MM for multi-modal multi-label image retrieval and classification problems by considering several state-of-the-art DL models. We also demonstrate that the DL models trained from scratch on BigEarthNet-MM outperform those pre-trained on ImageNet, especially in relation to some complex classes, including agriculture and other vegetated and natural environments. We make all the data and the DL models publicly available at https://bigearth.net, offering an important resource to support studies on multi-modal image scene classification and retrieval problems in RS.