arXiv reaDer
BTS-Net:RGB-D顕著な物体検出のための双方向転送および選択ネットワーク
BTS-Net: Bi-directional Transfer-and-Selection Network For RGB-D Salient Object Detection
深度情報は、RGB-D顕著な物体検出(SOD)で有益であることが証明されています。ただし、取得された深度マップは、品質が低く、不正確であることがよくあります。ほとんどの既存のRGB-DSODモデルには、クロスモーダル相互作用がないか、エンコーダーステージで深度からRGBへの一方向の相互作用しかないため、低品質の深度に直面すると、エンコーダー機能が不正確になる可能性があります。この制限に対処するために、エンコーダー段階の早い段階でプログレッシブ双方向相互作用を実行し、双方向転送と選択のセットを採用するBTS-Netという名前の新しい双方向転送と選択ネットワークを生成することを提案します。エンコード中に機能を浄化するための選択(BTS)モジュール。結果として得られる堅牢なエンコーダ機能に基づいて、正確な最終顕著性予測を実現するための効果的な軽量グループデコーダも設計します。広く使用されている6つのデータセットに関する包括的な実験は、BTS-Netが4つの主要な指標に関して16の最新のアプローチを上回っていることを示しています。
Depth information has been proved beneficial in RGB-D salient object detection (SOD). However, depth maps obtained often suffer from low quality and inaccuracy. Most existing RGB-D SOD models have no cross-modal interactions or only have unidirectional interactions from depth to RGB in their encoder stages, which may lead to inaccurate encoder features when facing low quality depth. To address this limitation, we propose to conduct progressive bi-directional interactions as early in the encoder stage, yielding a novel bi-directional transfer-and-selection network named BTS-Net, which adopts a set of bi-directional transfer-and-selection (BTS) modules to purify features during encoding. Based on the resulting robust encoder features, we also design an effective light-weight group decoder to achieve accurate final saliency prediction. Comprehensive experiments on six widely used datasets demonstrate that BTS-Net surpasses 16 latest state-of-the-art approaches in terms of four key metrics.
updated: Mon Apr 05 2021 05:58:43 GMT+0000 (UTC)
published: Mon Apr 05 2021 05:58:43 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト