通常、同じセマンティクスを持つオブジェクトは、異なる背景を含む画像で常に目立つとは限りません。正確に突出した物体の検出は前景と背景の両方に関連するというこの観察に基づいて、背景と前景の間の相互関係を共同で考慮して、効率的な突出した物体の検出を行う新しい協調的注意メカニズムを提案しました。具体的には、最初に従来の拡張FCNの各サイドアウトで機能を集約し、初期の前景と背景のローカル応答をそれぞれ抽出します。次に、これらの応答を入力として、相互注意モジュールは、前景と背景の特徴の任意の2ピクセル間の非局所的な依存関係を適応的にモデル化し、その後、各ブランチを強化してより差別的な前景を生成するように相互に強化された方法で局所的な特徴と集約します背景の顕著性マップ。さらに、協同損失は、前景と背景の分岐のマルチタスク学習を誘導するように特に設計されており、これにより、ネットワークは明確な境界でより補完的な予測を取得することができます。最後に、シンプルだが効果的な融合戦略を利用して、最終的な顕著性マップを作成します。 5つのベンチマークデータセットに関する包括的な実験結果は、提案された方法が、比較されたすべての評価指標に関して、最先端のアプローチに対して良好に機能することを示しています。
Typically, objects with the same semantics are not always prominent in images containing different backgrounds. Motivated by this observation that accurately salient object detection is related to both foreground and background, we proposed a novel cooperative attention mechanism that jointly considers reciprocal relationships between background and foreground for efficient salient object detection. Concretely, we first aggregate the features at each side-out of traditional dilated FCN to extract the initial foreground and background local responses respectively. Then taking these responses as input, reciprocal attention module adaptively models the nonlocal dependencies between any two pixels of the foreground and background features, which is then aggregated with local features in a mutual reinforced way so as to enhance each branch to generate more discriminative foreground and background saliency map. Besides, cooperative losses are particularly designed to guide the multi-task learning of foreground and background branches, which encourages our network to obtain more complementary predictions with clear boundaries. At last, a simple but effective fusion strategy is utilized to produce the final saliency map. Comprehensive experimental results on five benchmark datasets demonstrate that our proposed method performs favorably against the state-of-the-art approaches in terms of all compared evaluation metrics.