Ro-SOS: Metric Expression Network (MEnet) for Robust Salient Object Segmentation
 深いCNNは画像の顕著性の検出を大幅に改善しましたが、ほとんどのCNNベースのモデルは圧縮やノイズなどの歪みに敏感です。本論文では、歪みの許容度を伴う顕著性検出に対処するために、Metric Expression Network(MEnet)と呼ばれるエンドツーエンドの一般的な顕著なオブジェクトセグメンテーションモデルを提案します。 MEnet内では、新しいトポロジメトリック空間が構築され、その暗黙的なメトリックはディープネットワークによって決定されます。その結果、この潜在空間内で観察された画像のすべてのピクセルを意味的に2つの領域にグループ化することができます:顕著な領域と非顕著な領域。このアーキテクチャでは、すべての特徴抽出がピクセルレベルで実行されるため、顕著なオブジェクトの出力境界をきめ細かくすることができます。さらに、リプシッツとヤコビ文学の意味でのネットワークのノイズ耐性の一般的な分析を提供しようとします。実験により、提案されたメトリックによってオブジェクトのセグメンテーションを容易にする堅牢な顕著マップを生成できることが実証されています。いくつかの公開ベンチマークでのテストは、MEnetが望ましいパフォーマンスを達成したことを示しています。さらに、直接計算とロバスト性の測定により、提案された方法は、歪んだ入力に対して以前のCNNベースの方法よりも優れています。
Although deep CNNs have brought significant improvement to image saliency detection, most CNN based models are sensitive to distortion such as compression and noise. In this paper, we propose an end-to-end generic salient object segmentation model called Metric Expression Network (MEnet) to deal with saliency detection with the tolerance of distortion. Within MEnet, a new topological metric space is constructed, whose implicit metric is determined by the deep network. As a result, we manage to group all the pixels in the observed image semantically within this latent space into two regions: a salient region and a non-salient region. With this architecture, all feature extractions are carried out at the pixel level, enabling fine granularity of output boundaries of the salient objects. What's more, we try to give a general analysis for the noise robustness of the network in the sense of Lipschitz and Jacobian literature. Experiments demonstrate that robust salient maps facilitating object segmentation can be generated by the proposed metric. Tests on several public benchmarks show that MEnet has achieved desirable performance. Furthermore, by direct computation and measuring the robustness, the proposed method outperforms previous CNN-based methods on distorted inputs.
updated: Tue Jan 21 2020 20:41:52 GMT+0000 (UTC)
published: Tue May 15 2018 08:32:42 GMT+0000 (UTC)
