arXiv reaDer
顕著物体検出のための F 値に基づく正帰還法
A positive feedback method based on F-measure value for Salient Object Detection
現在の顕著な物体検出 (SOD) モデルの大部分は、完全な畳み込みネットワーク (FCN) または Transformer アーキテクチャに基づく一連のデコーダの設計と、それらを巧みな方法で統合することに重点を置いています。これらのモデルは目覚ましい高性能を達成し、SODの発展に大きく貢献しました。彼らの主な研究目的は、最先端のモデルを凌駕できる新しいアルゴリズムを開発することですが、これは非常に困難で時間のかかる作業です。これに対し、本論文では、既存の手法を用いた顕著性予測の精度向上を目的として、SOD の F 値に基づく正帰還手法を提案します。具体的には、提案された方法は、検出される画像を取得し、それをいくつかの既存のモデルに入力して、それぞれの予測マップを取得します。これらの予測マップは、慎重なデコーダーの設計やモデルのトレーニングを必要とせずに、最終的な予測結果を生成するために正のフィードバック メソッドに入力されます。さらに、私たちの方法は適応的であり、既存のモデルに基づいて制限なく実装できます。公開されている 5 つのデータセットに関する実験結果は、提案された正のフィードバック手法が、顕著性マップ予測の 5 つの評価指標で最新の 12 の手法よりも優れていることを示しています。さらに、ロバスト性実験を実施しました。これは、選択した既存のモデルに少なくとも 1 つの良好な予測結果が存在する場合、提案されたアプローチによって予測結果が悪化しないことを保証できることを示しています。私たちのアプローチは、低構成のホストで評価し、挿入されたモデルの予測時間のオーバーヘッドを取り除いた後、20 フレーム/秒 (FPS) の予測速度を達成します。これらの結果は、顕著な物体検出のために提案されたアプローチの有効性、効率、および堅牢性を強調しています。
The majority of current salient object detection (SOD) models are focused on designing a series of decoders based on fully convolutional networks (FCNs) or Transformer architectures and integrating them in a skillful manner. These models have achieved remarkable high performance and made significant contributions to the development of SOD. Their primary research objective is to develop novel algorithms that can outperform state-of-the-art models, a task that is extremely difficult and time-consuming. In contrast, this paper proposes a positive feedback method based on F-measure value for SOD, aiming to improve the accuracy of saliency prediction using existing methods. Specifically, our proposed method takes an image to be detected and inputs it into several existing models to obtain their respective prediction maps. These prediction maps are then fed into our positive feedback method to generate the final prediction result, without the need for careful decoder design or model training. Moreover, our method is adaptive and can be implemented based on existing models without any restrictions. Experimental results on five publicly available datasets show that our proposed positive feedback method outperforms the latest 12 methods in five evaluation metrics for saliency map prediction. Additionally, we conducted a robustness experiment, which shows that when at least one good prediction result exists in the selected existing model, our proposed approach can ensure that the prediction result is not worse. Our approach achieves a prediction speed of 20 frames per second (FPS) when evaluated on a low configuration host and after removing the prediction time overhead of inserted models. These results highlight the effectiveness, efficiency, and robustness of our proposed approach for salient object detection.
updated: Fri Apr 28 2023 04:05:13 GMT+0000 (UTC)
published: Fri Apr 28 2023 04:05:13 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト