高度な注意メカニズムを備えたマルチモーダル機能間の相乗効果を確立することにより、ライトフィールドの顕著な物体検出に対処するための新しい相乗的注意ネットワーク(SA-Net)を提案します。当社のSA-Netは、3D畳み込みニューラルネットワークを介してフォーカルスタックの豊富な情報を活用し、2つのカスケードされた相乗的注意モジュールを使用してマルチモーダルライトフィールドデータの高レベルの特徴をデコードし、プログレッシブマナー。広く使用されている3つのベンチマークデータセットでの広範な実験により、SA-Netは28の最先端モデルを上回り、その有効性と優位性が十分に実証されています。私たちのコードは一般に公開されます。
We propose a novel Synergistic Attention Network (SA-Net) to address the light field salient object detection by establishing a synergistic effect between multi-modal features with advanced attention mechanisms. Our SA-Net exploits the rich information of focal stacks via 3D convolutional neural networks, decodes the high-level features of multi-modal light field data with two cascaded synergistic attention modules, and predicts the saliency map using an effective feature fusion module in a progressive manner. Extensive experiments on three widely-used benchmark datasets show that our SA-Net outperforms 28 state-of-the-art models, sufficiently demonstrating its effectiveness and superiority. Our code will be made publicly available.