arXiv reaDer
リモートセンシング画像の超解像と物体検出:ベンチマークと最先端
Remote Sensing Image Super-resolution and Object Detection: Benchmark and State of the Art
過去20年間、リモートセンシング(RS)画像でオブジェクトを検出する方法を開発するための多大な努力がなされてきました。ほとんどの場合、リモートセンシング画像での小さな物体検出のデータセットは不十分です。多くの研究者は、オブジェクト検出にシーン分類データセットを使用しましたが、これには限界があります。たとえば、大きなサイズのオブジェクトは、オブジェクトカテゴリの小さなオブジェクトよりも数が多くなります。したがって、それらは多様性を欠いています。これは、RS画像内の小物体検出器の検出性能にさらに影響します。このホワイトペーパーでは、リモートセンシング画像の現在のデータセットとオブジェクト検出方法(ディープラーニングベース)について説明します。また、大規模で公開されているベンチマークリモートセンシング超解像オブジェクト検出(RSSOD)データセットを提案します。 RSSODデータセットは、空間解像度が約0.05 mの非常に高解像度(VHR)の画像の22,091個のインスタンスを含む1,759個の手動注釈付き画像で構成されています。クラスごとにラベルの頻度が異なる5つのクラスがあります。画像パッチは、接線スケール歪みやスキュー歪みなどの実際の画像歪みを含む衛星画像から抽出されます。また、画像の超解像ベースのオブジェクト検出をベンチマークし、既存の最先端の方法に基づいて比較するために、残留特徴集約(MCGR)と補助YOLOv5検出器を備えた新しいマルチクラスサイクリック超解像生成的敵対的ネットワークを提案します。画像の超解像(SR)。提案されたMCGRは、現在の最先端のNLSN法と比較して、1.2dB PSNRの改善により、画像SRの最先端のパフォーマンスを達成しました。 MCGRは、5クラス、4クラス、2クラス、および単一クラスで、それぞれ0.758、0.881、0.841、および0.983の最高のオブジェクト検出mAPを達成し、それぞれ最先端のオブジェクト検出器のパフォーマンスを上回りました。 YOLOv5、EfficientDet、Faster RCNN、SSD、およびRetinaNet。
For the past two decades, there have been significant efforts to develop methods for object detection in Remote Sensing (RS) images. In most cases, the datasets for small object detection in remote sensing images are inadequate. Many researchers used scene classification datasets for object detection, which has its limitations; for example, the large-sized objects outnumber the small objects in object categories. Thus, they lack diversity; this further affects the detection performance of small object detectors in RS images. This paper reviews current datasets and object detection methods (deep learning-based) for remote sensing images. We also propose a large-scale, publicly available benchmark Remote Sensing Super-resolution Object Detection (RSSOD) dataset. The RSSOD dataset consists of 1,759 hand-annotated images with 22,091 instances of very high resolution (VHR) images with a spatial resolution of ~0.05 m. There are five classes with varying frequencies of labels per class. The image patches are extracted from satellite images, including real image distortions such as tangential scale distortion and skew distortion. We also propose a novel Multi-class Cyclic super-resolution Generative adversarial network with Residual feature aggregation (MCGR) and auxiliary YOLOv5 detector to benchmark image super-resolution-based object detection and compare with the existing state-of-the-art methods based on image super-resolution (SR). The proposed MCGR achieved state-of-the-art performance for image SR with an improvement of 1.2dB PSNR compared to the current state-of-the-art NLSN method. MCGR achieved best object detection mAPs of 0.758, 0.881, 0.841, and 0.983, respectively, for five-class, four-class, two-class, and single classes, respectively surpassing the performance of the state-of-the-art object detectors YOLOv5, EfficientDet, Faster RCNN, SSD, and RetinaNet.
updated: Fri Nov 05 2021 04:56:34 GMT+0000 (UTC)
published: Fri Nov 05 2021 04:56:34 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト