arXiv reaDer
深度に敏感な注意と自動マルチモーダルフュージョンによる深いRGB-D顕著性検出
Deep RGB-D Saliency Detection with Depth-Sensitive Attention and Automatic Multi-Modal Fusion
RGB-D顕著なオブジェクト検出(SOD)は通常、RGBと深度の2つのモダリティにわたる分類または回帰の問題として定式化されます。したがって、効果的なRGBD特徴モデリングとマルチモーダル特徴融合の両方がRGB-DSODで重要な役割を果たします。この論文では、顕著なオブジェクトの深さ方向の幾何学的事前分布を使用して、深さに敏感なRGB特徴モデリングスキームを提案します。原則として、特徴モデリングスキームは、深度に敏感な注意モジュールで実行されます。これにより、事前に深度ジオメトリをキャプチャすることで、RGB機能の強化と背景の気晴らしの削減が実現します。さらに、効果的なマルチモーダル特徴融合を実行するために、RGB-D SODの自動アーキテクチャ検索アプローチをさらに提示します。これは、特別に設計されたマルチモーダルマルチスケール検索空間から実行可能アーキテクチャを見つけるのに役立ちます。 7つの標準ベンチマークでの広範な実験は、最先端技術に対する提案されたアプローチの有効性を示しています。
RGB-D salient object detection (SOD) is usually formulated as a problem of classification or regression over two modalities, i.e., RGB and depth. Hence, effective RGBD feature modeling and multi-modal feature fusion both play a vital role in RGB-D SOD. In this paper, we propose a depth-sensitive RGB feature modeling scheme using the depth-wise geometric prior of salient objects. In principle, the feature modeling scheme is carried out in a depth-sensitive attention module, which leads to the RGB feature enhancement as well as the background distraction reduction by capturing the depth geometry prior. Moreover, to perform effective multi-modal feature fusion, we further present an automatic architecture search approach for RGB-D SOD, which does well in finding out a feasible architecture from our specially designed multi-modal multi-scale search space. Extensive experiments on seven standard benchmarks demonstrate the effectiveness of the proposed approach against the state-of-the-art.
updated: Mon Mar 22 2021 13:28:45 GMT+0000 (UTC)
published: Mon Mar 22 2021 13:28:45 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト