自然シーン画像(NSI)の視覚的顕著性分析の目覚ましい進歩にもかかわらず、光学リモートセンシング画像(RSI)の顕著な物体検出(SOD)は、未解決で困難な問題のままです。この論文では、光RSIのSODのためのエンドツーエンドの高密度注意流体ネットワーク(DAFNet)を提案します。グローバルコンテキストアウェアアテンション(GCA)モジュールは、長距離のセマンティックコンテキスト関係を適応的にキャプチャするために提案され、さらに、浅いアテンションキューが深い層に流れて高層の生成をガイドできるようにする高密度アテンション流体(DAF)構造に組み込まれていますレベルの機能アテンションマップ。具体的には、GCAモジュールは2つの主要コンポーネントで構成され、グローバルフィーチャ集約モジュールは、任意の2つの空間位置からの顕著なフィーチャ埋め込みの相互強化を実現し、カスケードピラミッドアテンションモジュールは、カスケードピラミッドフレームワークを構築することにより、スケール変動の問題に取り組みます。アテンションマップを粗い方法から細かい方法で段階的に調整します。さらに、SOD用の新しくてやりがいのある光学RSIデータセットを構築します。このデータセットには、ピクセル単位の顕著性注釈付きの2,000枚の画像が含まれています。広範な実験により、提案されたDAFNetは、既存の最先端のSOD競合他社を大幅に上回っています。 https://github.com/rmcong/DAFNet_TIP20
Despite the remarkable advances in visual saliency analysis for natural scene images (NSIs), salient object detection (SOD) for optical remote sensing images (RSIs) still remains an open and challenging problem. In this paper, we propose an end-to-end Dense Attention Fluid Network (DAFNet) for SOD in optical RSIs. A Global Context-aware Attention (GCA) module is proposed to adaptively capture long-range semantic context relationships, and is further embedded in a Dense Attention Fluid (DAF) structure that enables shallow attention cues flow into deep layers to guide the generation of high-level feature attention maps. Specifically, the GCA module is composed of two key components, where the global feature aggregation module achieves mutual reinforcement of salient feature embeddings from any two spatial locations, and the cascaded pyramid attention module tackles the scale variation issue by building up a cascaded pyramid framework to progressively refine the attention map in a coarse-to-fine manner. In addition, we construct a new and challenging optical RSI dataset for SOD that contains 2,000 images with pixel-wise saliency annotations, which is currently the largest publicly available benchmark. Extensive experiments demonstrate that our proposed DAFNet significantly outperforms the existing state-of-the-art SOD competitors. https://github.com/rmcong/DAFNet_TIP20