高解像度のリモートセンシング画像からのセマンティックセグメンテーションは、衛星画像処理における緊急の問題です。複雑な環境のため、自動分類とセグメント化は、特に高解像度の画像にとっては難しい問題です。それを解決することは、都市計画、環境保護、自然景観の監視におけるさまざまな障害を克服するのに役立ち、完全なシーン理解への道を開きます。ただし、既存の頻繁に使用されるエンコーダ-デコーダ構造では、抽出された空間的特徴とコンテキスト的特徴を効果的に組み合わせることができません。したがって、このホワイトペーパーでは、低レベル機能と高レベル機能の間のギャップを埋めるために、機能ピラミッドネットワーク(FPN)を紹介します。さらに、精巧なマルチヘッドアテンションモジュールでコンテキスト情報を強化し、高解像度のリモートセンシング画像のセマンティックセグメンテーションのためのマルチヘッドアテンション付き機能ピラミッドネットワーク(FPN-MHA)を提案します。 ISPRSポツダムとヴァイヒンゲンのデータセットで実施された広範な実験は、FPN-MHAの有効性を示しています。コードはhttps://github.com/lironui/FPN-MHAで入手できます。
Semantic segmentation from fine-resolution remotely sensed images is an urgent issue in satellite imagery processing. Due to the complicated environment, automatic categorization and segmen-tation is a challenging matter especially for images with a fine resolution. Solving it can help to surmount a wide varied range of obstacles in urban planning, environmental protection, and natural landscape monitoring, which paves the way for complete scene understanding. However, the existing frequently-used encoder-decoder structure is unable to effectively combine the extracted spatial and contextual features. Therefore, in this paper, we introduce the Feature Pyramid Net-work (FPN) to bridge the gap between the low-level and high-level features. Moreover, we enhance the contextual information with the elaborate Multi-Head Attention module and propose the Feature Pyramid Network with Multi-Head Attention (FPN-MHA) for semantic segmentation of fine-resolution remotely sensed images. Extensive experiments conducted on the ISPRS Potsdam and Vaihingen datasets demonstrate the effectiveness of our FPN-MHA. Code is available at https://github.com/lironui/FPN-MHA.