arXiv reaDer
統合スペクトル空間特徴集約によるハイパースペクトル画像内の物体検出
Object Detection in Hyperspectral Image via Unified Spectral-Spatial Feature Aggregation
深層学習ベースのハイパースペクトル画像 (HSI) 分類および物体検出技術は、画像コンテンツの分析、解釈、およびより広範な HSI アプリケーションにおいて重要な役割を果たしているため、大きな注目を集めています。しかし、現在のハイパースペクトル物体検出アプローチは、主にスペクトルまたは空間情報のいずれかを強調しており、これら 2 つの側面の間の貴重な補完関係が見落とされています。この研究では、ハイパースペクトル画像に固有の豊富なスペクトルおよび空間相補情報を効果的に利用する、新しいスペクトル空間集約 (S2ADet) 物体検出器を紹介します。 S2ADet は、ハイパースペクトル情報デカップリング (HID) モジュール、2 ストリーム特徴抽出ネットワーク、および 1 段階検出ヘッドで構成されています。 HID モジュールは、帯域選択と主成分分析を通じてスペクトル情報と空間情報を集約することによりハイパースペクトル イメージを処理し、その結果冗長性を削減します。取得した空間およびスペクトル集約情報に基づいて、スペクトル空間特徴を相互作用させるための特徴集約 2 ストリーム ネットワークを提案します。さらに、既存のデータベースの制限に対処するために、HOD3K と呼ばれる広範なデータセットに注釈を付けます。このデータセットには、現実世界のさまざまなシーンにわたってキャプチャされ、3 つのオブジェクト クラスを含む 3,242 枚のハイパースペクトル画像が含まれています。これらの画像は 512x256 ピクセルの解像度を持ち、470 nm ~ 620 nm の範囲の 16 バンドをカバーしています。 2 つのデータセットに対する包括的な実験により、S2ADet が既存の最先端の手法を上回り、堅牢で信頼性の高い結果が得られることが実証されました。この作業のデモ コードとデータセットは、https://github.com/hexiao-cs/S2ADet で公開されています。
Deep learning-based hyperspectral image (HSI) classification and object detection techniques have gained significant attention due to their vital role in image content analysis, interpretation, and wider HSI applications. However, current hyperspectral object detection approaches predominantly emphasize either spectral or spatial information, overlooking the valuable complementary relationship between these two aspects. In this study, we present a novel Spectral-Spatial Aggregation (S2ADet) object detector that effectively harnesses the rich spectral and spatial complementary information inherent in hyperspectral images. S2ADet comprises a hyperspectral information decoupling (HID) module, a two-stream feature extraction network, and a one-stage detection head. The HID module processes hyperspectral images by aggregating spectral and spatial information via band selection and principal components analysis, consequently reducing redundancy. Based on the acquired spatial and spectral aggregation information, we propose a feature aggregation two-stream network for interacting spectral-spatial features. Furthermore, to address the limitations of existing databases, we annotate an extensive dataset, designated as HOD3K, containing 3,242 hyperspectral images captured across diverse real-world scenes and encompassing three object classes. These images possess a resolution of 512x256 pixels and cover 16 bands ranging from 470 nm to 620 nm. Comprehensive experiments on two datasets demonstrate that S2ADet surpasses existing state-of-the-art methods, achieving robust and reliable results. The demo code and dataset of this work are publicly available at https://github.com/hexiao-cs/S2ADet.
updated: Wed Jun 14 2023 09:01:50 GMT+0000 (UTC)
published: Wed Jun 14 2023 09:01:50 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト