arXiv reaDer
RGB-D顕著な物体検出のためのマルチスケール反復精密化ネットワーク
Multi-Scale Iterative Refinement Network for RGB-D Salient Object Detection
RGB-D情報を活用した広範な研究は、顕著な物体検出に活用されています。ただし、顕著な視覚的手がかりは、さまざまな機能レベルでのセマンティックギャップのために、RGB画像のさまざまなスケールと解像度で表示されます。一方、同様の顕著なパターンは、クロスモーダル深度画像とマルチスケールバージョンで利用できます。クロスモーダルフュージョンとマルチスケールリファインメントは、RGB-Dの顕著なオブジェクト検出タスクで未解決の問題です。このホワイトペーパーでは、まずトップダウンとボトムアップの反復改良アーキテクチャを導入してマルチスケール機能を活用し、次にアテンションベースのフュージョンモジュール(ABF)を考案してクロスモーダル相関に対処します。 7つの公開データセットで広範な実験を実施します。実験結果は、私たちが考案した方法の有効性を示しています
The extensive research leveraging RGB-D information has been exploited in salient object detection. However, salient visual cues appear in various scales and resolutions of RGB images due to semantic gaps at different feature levels. Meanwhile, similar salient patterns are available in cross-modal depth images as well as multi-scale versions. Cross-modal fusion and multi-scale refinement are still an open problem in RGB-D salient object detection task. In this paper, we begin by introducing top-down and bottom-up iterative refinement architecture to leverage multi-scale features, and then devise attention based fusion module (ABF) to address on cross-modal correlation. We conduct extensive experiments on seven public datasets. The experimental results show the effectiveness of our devised method
updated: Mon Jan 24 2022 10:33:00 GMT+0000 (UTC)
published: Mon Jan 24 2022 10:33:00 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト