arXiv reaDer
窓の外を見る:高解像度リモートセンシング画像のセマンティックセグメンテーションのためのワイドコンテキストトランスフォーマー
Looking Outside the Window: Wide-Context Transformer for the Semantic Segmentation of High-Resolution Remote Sensing Images
長距離のコンテキスト情報は、高解像度(HR)リモートセンシング画像(RSI)のセマンティックセグメンテーションにとって重要です。ただし、ニューラルネットワークのトレーニングに一般的に使用される画像トリミング操作は、大規模なRSIでの長距離コンテキストの認識を制限します。この制限を克服するために、HR RSIのセマンティックセグメンテーション用のワイドコンテキストネットワーク(WiCoNet)を提案します。従来のCNNでローカル機能を抽出する以外に、WiCoNetには、より大きな画像領域から情報を集約するための追加のコンテキストブランチがあります。さらに、コンテキストトランスフォーマーを導入して、コンテキストブランチからのコンテキスト情報を埋め込み、ローカル機能に選択的に投影します。 Context Transformerは、新しい種類のニューラルネットワークであるVision Transformerを拡張して、デュアルブランチセマンティック相関をモデル化します。これは、CNNの局所性の制限を克服し、土地被覆/土地利用(LCLU)クラスをセグメント化する前にWiCoNetが全体像を確認できるようにします。いくつかのベンチマークデータセットで実施されたアブレーション研究と比較実験は、提案された方法の有効性を示しています。さらに、新しい北京土地利用(BLU)データセットを紹介します。これは、この分野での将来の研究を容易にすることができる、高品質できめの細かい参照ラベルを備えた大規模なHR衛星データセットです。
Long-range contextual information is crucial for the semantic segmentation of High-Resolution (HR) Remote Sensing Images (RSIs). However, image cropping operations, commonly used for training neural networks, limit the perception of long-range contexts in large RSIs. To overcome this limitation, we propose a Wide-Context Network (WiCoNet) for the semantic segmentation of HR RSIs. Apart from extracting local features with a conventional CNN, the WiCoNet has an extra context branch to aggregate information from a larger image area. Moreover, we introduce a Context Transformer to embed contextual information from the context branch and selectively project it onto the local features. The Context Transformer extends the Vision Transformer, an emerging kind of neural networks, to model the dual-branch semantic correlations. It overcomes the locality limitation of CNNs and enables the WiCoNet to see the bigger picture before segmenting the land-cover/land-use (LCLU) classes. Ablation studies and comparative experiments conducted on several benchmark datasets demonstrate the effectiveness of the proposed method. In addition, we present a new Beijing Land-Use (BLU) dataset. This is a large-scale HR satellite dataset with high-quality and fine-grained reference labels, which can facilitate future studies in this field.
updated: Fri Oct 08 2021 08:45:52 GMT+0000 (UTC)
published: Tue Jun 29 2021 23:41:54 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト