arXiv reaDer
学習可能な 3D グループ畳み込みに基づく空間スペクトル ハイパースペクトル分類
Spatial-Spectral Hyperspectral Classification based on Learnable 3D Group Convolution
ディープ ニューラル ネットワークは、スペクトル空間結合情報の非効果的な利用や、深度の増加に伴って発生する勾配消失や過剰適合の問題など、ハイパースペクトル画像分類において多くの問題に直面しています。厳格なレイテンシ要件と制限されたコンピューティング能力を持つエッジ デバイスへのモデルの展開を加速するために、この論文では、改良された 3D-DenseNet モデルと軽量モデル設計に基づく学習可能なグループ畳み込みネットワーク (LGCNet) を提案します。 LGCNet モジュールは、入力チャネルとコンボリューション カーネル グループ化の動的学習方法を導入することでグループ コンボリューションの欠点を改善し、柔軟なグループ化構造を可能にし、より優れた表現能力を生成します。逆伝播ネットワークの全体的な損失と勾配を通じて、3D グループ畳み込みが動的に決定され、エンドツーエンド方式で更新されます。学習可能なチャネル数と対応するグループ化により、入力画像のさまざまな相補的な視覚特徴をキャプチャできるため、CNN はより豊富な特徴表現を学習できます。高次元の冗長なハイパースペクトル データを抽出する場合、3D コンボリューション カーネルには大量の冗長情報も含まれます。 LGC モジュールを使用すると、3D-DenseNet はよりセマンティックな特徴を持つチャネル情報を選択できるようになり、非常に効率的であるため、加速と効率の向上のためにディープ ニューラル ネットワークに組み込むのに適しています。 LGC により、3D-CNN は速度とコンピューティング要件を満たしながら、十分な特徴抽出を実現できます。さらに、LGCNet は推論の速度と精度において進歩を遂げており、Indian Pines、Pavia University、および KSC データセットにおける主流のハイパースペクトル画像分類手法を上回っています。
Deep neural networks have faced many problems in hyperspectral image classification, including the ineffective utilization of spectral-spatial joint information and the problems of gradient vanishing and overfitting that arise with increasing depth. In order to accelerate the deployment of models on edge devices with strict latency requirements and limited computing power, this paper proposes a learnable group convolution network (LGCNet) based on an improved 3D-DenseNet model and a lightweight model design. The LGCNet module improves the shortcomings of group convolution by introducing a dynamic learning method for the input channels and convolution kernel grouping, enabling flexible grouping structures and generating better representation ability. Through the overall loss and gradient of the backpropagation network, the 3D group convolution is dynamically determined and updated in an end-to-end manner. The learnable number of channels and corresponding grouping can capture different complementary visual features of input images, allowing the CNN to learn richer feature representations. When extracting high-dimensional and redundant hyperspectral data, the 3D convolution kernels also contain a large amount of redundant information. The LGC module allows the 3D-DenseNet to choose channel information with more semantic features, and is very efficient, making it suitable for embedding in any deep neural network for acceleration and efficiency improvements. LGC enables the 3D-CNN to achieve sufficient feature extraction while also meeting speed and computing requirements. Furthermore, LGCNet has achieved progress in inference speed and accuracy, and outperforms mainstream hyperspectral image classification methods on the Indian Pines, Pavia University, and KSC datasets.
updated: Sat Jul 15 2023 05:47:12 GMT+0000 (UTC)
published: Sat Jul 15 2023 05:47:12 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト