arXiv reaDer
特異性を維持するRGB-D顕著性検出
Specificity-preserving RGB-D Saliency Detection
RGB-D顕著性検出は、その有効性と奥行きの手がかりを便利にキャプチャできるようになったため、ますます注目を集めています。既存の作品は、多くの場合、さまざまな融合戦略を通じて共有表現を学習することに焦点を当てており、モダリティ固有の特性を保持する方法を明示的に検討する方法はほとんどありません。本論文では、新しい視点から、RGB-D顕著性検出のための特異性保存ネットワーク(SP-Net)を提案します。これは、共有情報とモダリティ固有のプロパティ(特異性など)の両方を調査することで顕著性検出パフォーマンスにメリットをもたらします。具体的には、2つのモダリティ固有のネットワークと共有学習ネットワークを採用して、個別の共有顕著性マップを生成します。クロスエンハンスド統合モジュール(CIM)は、共有学習ネットワークのクロスモーダル機能を融合するために提案され、クロスレベル情報を統合するために次のレイヤーに伝播されます。さらに、個々のデコーダーからのモダリティ固有の機能を共有デコーダーに統合するマルチモーダル機能集約(MFA)モジュールを提案します。これにより、顕著性検出パフォーマンスを向上させる豊富な補完マルチモーダル情報を提供できます。さらに、スキップ接続は、エンコーダー層とデコーダー層の間の階層機能を組み合わせるために使用されます。 6つのベンチマークデータセットでの実験は、SP-Netが他の最先端の方法よりも優れていることを示しています。コードはhttps://github.com/taozh2017/SPNetで入手できます。
RGB-D saliency detection has attracted increasing attention, due to its effectiveness and the fact that depth cues can now be conveniently captured. Existing works often focus on learning a shared representation through various fusion strategies, with few methods explicitly considering how to preserve modality-specific characteristics. In this paper, taking a new perspective, we propose a specificity-preserving network (SP-Net) for RGB-D saliency detection, which benefits saliency detection performance by exploring both the shared information and modality-specific properties (e.g., specificity). Specifically, two modality-specific networks and a shared learning network are adopted to generate individual and shared saliency maps. A cross-enhanced integration module (CIM) is proposed to fuse cross-modal features in the shared learning network, which are then propagated to the next layer for integrating cross-level information. Besides, we propose a multi-modal feature aggregation (MFA) module to integrate the modality-specific features from each individual decoder into the shared decoder, which can provide rich complementary multi-modal information to boost the saliency detection performance. Further, a skip connection is used to combine hierarchical features between the encoder and decoder layers. Experiments on six benchmark datasets demonstrate that our SP-Net outperforms other state-of-the-art methods. Code is available at: https://github.com/taozh2017/SPNet.
updated: Wed Aug 18 2021 14:14:22 GMT+0000 (UTC)
published: Wed Aug 18 2021 14:14:22 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト