DNA: Deeply-supervised Nonlinear Aggregation for Salient Object Detection
顕著なオブジェクトの検出に関する最近の進歩は、主に、畳み込みニューラルネットワーク(CNN)でマルチスケールの畳み込み機能を効果的に統合する方法を利用することを目的としています。多くの一般的な方法は、最終的な顕著性予測のために線形に集計される副出力予測を実行するために、深い監督を課します。このホワイトペーパーでは、副出力予測の線形集約が最適ではないことを理論的および実験的に示し、詳細な監視によって得られた副出力情報を限定的に使用するだけです。この問題を解決するために、さまざまな副出力の補足情報をより適切に活用するために、Deeply-supervised Nonlinear Aggregation(DNA)を提案します。既存の方法と比較して、i)予測ではなく副出力特徴を集約し、ii)線形変換ではなく非線形変換を採用します。実験は、DNAが現在の線形アプローチのボトルネックを首尾よく突破できることを示しています。具体的には、提案された顕著性検出器(DNAを使用した修正U-Netアーキテクチャー)は、さまざまなデータセットや評価指標の最先端の手法に対して有利に機能します。
Recent progress on salient object detection mainly aims at exploiting how to effectively integrate multi-scale convolutional features in convolutional neural networks (CNNs). Many popular methods impose deep supervision to perform side-output predictions that are linearly aggregated for final saliency prediction. In this paper, we theoretically and experimentally demonstrate that linear aggregation of side-output predictions is suboptimal, and it only makes limited use of the side-output information obtained by deep supervision. To solve this problem, we propose Deeply-supervised Nonlinear Aggregation (DNA) for better leveraging the complementary information of various side-outputs. Compared with existing methods, it i) aggregates side-output features rather than predictions, and ii) adopts nonlinear instead of linear transformations. Experiments demonstrate that DNA can successfully break through the bottleneck of current linear approaches. Specifically, the proposed saliency detector, a modified U-Net architecture with DNA, performs favorably against state-of-the-art methods on various datasets and evaluation metrics without bells and whistles.
updated: Wed Jan 20 2021 06:22:08 GMT+0000 (UTC)
published: Thu Mar 28 2019 01:41:40 GMT+0000 (UTC)
