arXiv reaDer
MP-ResNet:高解像度PolSAR画像のセマンティックセグメンテーションのためのマルチパス残余ネットワーク
MP-ResNet: Multi-path Residual Network for the Semantic segmentation of High-Resolution PolSAR Images
トレーニングデータの不足とスペックルノイズの推論のため、高解像度の偏光合成開口レーダー(PolSAR)画像のセマンティックセグメンテーションに関する研究は限られています。高分コンテストは、高品質のPolSARセマンティックセグメンテーションデータセットへのオープンアクセスを提供しました。この機会を利用して、高解像度PolSAR画像のセマンティックセグメンテーションのためのマルチパスResNet(MP-ResNet)アーキテクチャを提案します。従来のU字型エンコーダ-デコーダ畳み込みニューラルネットワーク(CNN)アーキテクチャと比較して、MP-ResNetは、並列マルチスケールブランチを使用してセマンティックコンテキストを学習します。これにより、有効な受容野が大幅に拡大され、局所的な識別機能の埋め込みが改善されます。さらに、MP-ResNetは、デコーダーにマルチレベルの機能融合設計を採用して、さまざまなブランチから学習した機能を最大限に活用します。アブレーション研究は、MPResNetがそのベースライン法(ResNet34を使用したFCN)に比べて大きな利点があることを示しています。また、全体的な精度(OA)、平均F1およびfwIoUの点で、いくつかの従来の最先端の方法を上回っていますが、計算コストはそれほど増加していません。このCNNアーキテクチャは、PolSAR画像のセマンティックセグメンテーションに関する将来の研究のベースラインメソッドとして使用できます。コードはhttps://github.com/ggsDing/SARSegで入手できます。
There are limited studies on the semantic segmentation of high-resolution Polarimetric Synthetic Aperture Radar (PolSAR) images due to the scarcity of training data and the inference of speckle noises. The Gaofen contest has provided open access of a high-quality PolSAR semantic segmentation dataset. Taking this chance, we propose a Multi-path ResNet (MP-ResNet) architecture for the semantic segmentation of high-resolution PolSAR images. Compared to conventional U-shape encoder-decoder convolutional neural network (CNN) architectures, the MP-ResNet learns semantic context with its parallel multi-scale branches, which greatly enlarges its valid receptive fields and improves the embedding of local discriminative features. In addition, MP-ResNet adopts a multi-level feature fusion design in its decoder to make the best use of the features learned from its different branches. Ablation studies show that the MPResNet has significant advantages over its baseline method (FCN with ResNet34). It also surpasses several classic state-of-the-art methods in terms of overall accuracy (OA), mean F1 and fwIoU, whereas its computational costs are not much increased. This CNN architecture can be used as a baseline method for future studies on the semantic segmentation of PolSAR images. The code is available at: https://github.com/ggsDing/SARSeg.
updated: Mon Nov 16 2020 14:02:58 GMT+0000 (UTC)
published: Tue Nov 10 2020 13:28:36 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト