arXiv reaDer
PanFormer:パンシャープニング用のトランスフォーマーベースのモデル
PanFormer: a Transformer Based Model for Pan-sharpening
パンシャープンは、同じ衛星によって取得された低解像度(LR)マルチスペクトル(MS)画像とそれに対応するパンクロマティック(PAN)画像から高解像度(HR)マルチスペクトル(MS)画像を生成することを目的としています。最近の深層学習コミュニティの新しいファッションに触発されて、パンシャープン用の新しいTransformerベースのモデルを提案します。画像特徴抽出と融合におけるTransformerの可能性を探ります。ビジョントランスフォーマーの開発が成功した後、PANおよびMSモダリティからモダリティ固有の機能を抽出し、クロスアテンションモジュールを適用してスペクトル機能と空間機能をマージする自己注意を備えた2ストリームネットワークを設計します。パンシャープン画像は、強化された融合機能から生成されます。 GaoFen-2およびWorldView-3画像での広範な実験は、Transformerベースのモデルが印象的な結果を達成し、多くの既存のCNNベースの方法よりも優れていることを示しています。これは、Transformerをパンシャープンタスクに導入する大きな可能性を示しています。コードはhttps://github.com/zhysora/PanFormerで入手できます。
Pan-sharpening aims at producing a high-resolution (HR) multi-spectral (MS) image from a low-resolution (LR) multi-spectral (MS) image and its corresponding panchromatic (PAN) image acquired by a same satellite. Inspired by a new fashion in recent deep learning community, we propose a novel Transformer based model for pan-sharpening. We explore the potential of Transformer in image feature extraction and fusion. Following the successful development of vision transformers, we design a two-stream network with the self-attention to extract the modality-specific features from the PAN and MS modalities and apply a cross-attention module to merge the spectral and spatial features. The pan-sharpened image is produced from the enhanced fused features. Extensive experiments on GaoFen-2 and WorldView-3 images demonstrate that our Transformer based model achieves impressive results and outperforms many existing CNN based methods, which shows the great potential of introducing Transformer to the pan-sharpening task. Codes are available at https://github.com/zhysora/PanFormer.
updated: Tue Mar 22 2022 07:01:11 GMT+0000 (UTC)
published: Sun Mar 06 2022 09:22:20 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト