ディープ ラーニング ベースの教師なし顕著なオブジェクト検出 (USOD) は、主に、従来のハンドクラフト手法または事前トレーニング済みネットワークから生成されたノイズの多い顕著性の疑似ラベルに依存しています。ノイズの多いラベルの問題に対処するために、メソッドのクラスは、信頼できるラベルを持つ簡単なサンプルのみに焦点を当て、ハード サンプルの貴重な知識を無視します。この論文では、簡単なサンプルと難しいサンプルの両方から豊富で正確な顕著性知識をマイニングするための新しい USOD メソッドを提案します。最初に、サンプルの信頼性に基づいて条件付けられたサンプルをスコアリングする信頼性を意識した顕著性蒸留 (CSD) 戦略を提案します。次に、境界を意識したテクスチャ マッチング (BTM) 戦略を提案し、予測された境界の周りのテクスチャを一致させることによって、ノイズの多いラベルの境界を調整します。 RGB、RGB-D、RGB-T、およびビデオ SOD ベンチマークに関する広範な実験により、私たちの方法が最先端の USOD パフォーマンスを達成することが証明されています。
Deep Learning-based Unsupervised Salient Object Detection (USOD) mainly relies on the noisy saliency pseudo labels that have been generated from traditional handcraft methods or pre-trained networks. To cope with the noisy labels problem, a class of methods focus on only easy samples with reliable labels but ignore valuable knowledge in hard samples. In this paper, we propose a novel USOD method to mine rich and accurate saliency knowledge from both easy and hard samples. First, we propose a Confidence-aware Saliency Distilling (CSD) strategy that scores samples conditioned on samples' confidences, which guides the model to distill saliency knowledge from easy samples to hard samples progressively. Second, we propose a Boundary-aware Texture Matching (BTM) strategy to refine the boundaries of noisy labels by matching the textures around the predicted boundary. Extensive experiments on RGB, RGB-D, RGB-T, and video SOD benchmarks prove that our method achieves state-of-the-art USOD performance.