arXiv reaDer
FAIR1M:高解像度リモートセンシング画像におけるきめ細かい物体認識のためのベンチマークデータセット
FAIR1M: A Benchmark Dataset for Fine-grained Object Recognition in High-Resolution Remote Sensing Imagery
ディープラーニングの急速な発展に伴い、多くのディープラーニングベースのアプローチがオブジェクト検出タスクで大きな成果を上げています。ディープラーニングはデータ駆動型の方法であることが一般的に知られています。データは、オブジェクト検出器のパフォーマンスにある程度直接影響します。既存のデータセットにはリモートセンシング画像に共通のオブジェクトが含まれていますが、スケール、カテゴリ、画像に関してはまだいくつかの制限があります。したがって、高解像度のリモートセンシング画像における物体検出に関する大規模なベンチマークを確立することが強く求められています。この論文では、FAIR1Mと名付けられた高解像度リモートセンシング画像における微細な物体認識のために、100万を超えるインスタンスと15,000を超える画像を備えた新しいベンチマークデータセットを提案します。 FAIR1Mデータセット内のすべてのオブジェクトには、方向付けられた境界ボックスによって5つのカテゴリと37のサブカテゴリに関して注釈が付けられています。オブジェクト検出専用の既存の検出データセットと比較すると、FAIR1Mデータセットには4つの特定の特性があります。(1)インスタンスの量と画像の量の両方の点で他の既存のオブジェクト検出データセットよりもはるかに大きい、(2)提供するリモートセンシング画像内のオブジェクトのより豊富なきめ細かいカテゴリ情報、(3)緯度、経度、解像度などの地理情報が含まれています。(4)慎重なデータクリーニング手順により、より優れた画質が提供されます。きめ細かいオブジェクト認識のベースラインを確立するために、FAIR1Mデータセットのいくつかの最先端(SOTA)深層学習ベースのモデルを使用して、新しい評価方法とベンチマークのきめ細かいオブジェクト検出タスクおよび視覚的分類タスクを提案します。 。実験結果は、FAIR1Mデータセットが実際のアプリケーションに近く、既存のデータセットよりもかなり難しいことを強く示しています。
With the rapid development of deep learning, many deep learning based approaches have made great achievements in object detection task. It is generally known that deep learning is a data-driven method. Data directly impact the performance of object detectors to some extent. Although existing datasets have included common objects in remote sensing images, they still have some limitations in terms of scale, categories, and images. Therefore, there is a strong requirement for establishing a large-scale benchmark on object detection in high-resolution remote sensing images. In this paper, we propose a novel benchmark dataset with more than 1 million instances and more than 15,000 images for Fine-grAined object recognItion in high-Resolution remote sensing imagery which is named as FAIR1M. All objects in the FAIR1M dataset are annotated with respect to 5 categories and 37 sub-categories by oriented bounding boxes. Compared with existing detection datasets dedicated to object detection, the FAIR1M dataset has 4 particular characteristics: (1) it is much larger than other existing object detection datasets both in terms of the quantity of instances and the quantity of images, (2) it provides more rich fine-grained category information for objects in remote sensing images, (3) it contains geographic information such as latitude, longitude and resolution, (4) it provides better image quality owing to a careful data cleaning procedure. To establish a baseline for fine-grained object recognition, we propose a novel evaluation method and benchmark fine-grained object detection tasks and a visual classification task using several State-Of-The-Art (SOTA) deep learning based models on our FAIR1M dataset. Experimental results strongly indicate that the FAIR1M dataset is closer to practical application and it is considerably more challenging than existing datasets.
updated: Tue Mar 09 2021 17:20:15 GMT+0000 (UTC)
published: Tue Mar 09 2021 17:20:15 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト