arXiv reaDer
RGB-D顕著性検出のためのトランスベースのネットワーク
Transformer-based Network for RGB-D Saliency Detection
RGB-D顕著性検出は、RGB画像と深度マップの両方からの情報を統合して、困難な条件下での顕著な領域の予測を改善します。 RGB-D顕著性検出の鍵は、2つのモダリティにわたって複数のスケールで情報を完全にマイニングおよび融合することです。以前のアプローチでは、ローカル操作を介してマルチスケールとマルチモーダルの融合を別々に適用する傾向があり、長距離の依存関係をキャプチャできません。ここでは、この問題に対処するための変圧器ベースのネットワークを提案します。提案するアーキテクチャは、トランスベースのモダリティ内機能拡張モジュール(TWFEM)とトランスベースの機能融合モジュール(TFFM)の2つのモジュールで構成されています。 TFFMは、複数のスケールと2つのモダリティからの機能をすべての位置で同時に統合することにより、十分な機能融合を実行します。 TWFEMは、TFFMの前に同じモダリティ内の他のスケールから補完的な情報を選択して統合することにより、各スケールの機能を強化します。トランスは、機能の融合と機能の強化の両方で優れた効果を発揮し、モデル設計を簡素化する均一な動作であることを示します。 6つのベンチマークデータセットに関する広範な実験結果は、提案されたネットワークが最先端のRGB-D顕著性検出方法に対して良好に機能することを示しています。
RGB-D saliency detection integrates information from both RGB images and depth maps to improve prediction of salient regions under challenging conditions. The key to RGB-D saliency detection is to fully mine and fuse information at multiple scales across the two modalities. Previous approaches tend to apply the multi-scale and multi-modal fusion separately via local operations, which fails to capture long-range dependencies. Here we propose a transformer-based network to address this issue. Our proposed architecture is composed of two modules: a transformer-based within-modality feature enhancement module (TWFEM) and a transformer-based feature fusion module (TFFM). TFFM conducts a sufficient feature fusion by integrating features from multiple scales and two modalities over all positions simultaneously. TWFEM enhances feature on each scale by selecting and integrating complementary information from other scales within the same modality before TFFM. We show that transformer is a uniform operation which presents great efficacy in both feature fusion and feature enhancement, and simplifies the model design. Extensive experimental results on six benchmark datasets demonstrate that our proposed network performs favorably against state-of-the-art RGB-D saliency detection methods.
updated: Wed Dec 01 2021 15:53:58 GMT+0000 (UTC)
published: Wed Dec 01 2021 15:53:58 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト