視覚的注意は、外部の冗長性の世界を選択して理解するための最も重要な特性の1つです。より大きな冗長性と人間の視覚を含む自然の複雑なシーンは、情報のボトルネックのためにすべての情報を同時に処理することはできません。人間の視覚システムは、入力された視覚的冗長性情報を減らすために、主にシーンの支配的な部分に焦点を合わせています。これは一般に、視覚的注意予測または視覚的顕著性マップとして知られています。この論文は、人間の低レベルの視覚野機能に触発された新しい顕著性予測アーキテクチャWECSFを提案します。このモデルは、対戦相手のカラーチャネル、ウェーブレット変換、ウェーブレットエネルギーマップ、および低レベルの画像特徴と人間の視覚系への最大近似を抽出するためのコントラスト感度関数で構成されています。提案されたモデルは、MIT1003、MIT300、TORONTO、SID4VAM、およびUCF Sportsデータセットを含むいくつかのデータセットを評価して、その効率を説明します。提案されたモデルの結果は、他の最先端の顕著性予測モデルと定量的および定性的に比較されます。ベースラインモデルと比較して、私たちのモデルは非常に優れたパフォーマンスを達成しました。次に、フーリエ/スペクトルに触発された顕著性予測モデルが、他の最先端の非ニューラルネットワークや単純な画像のディープニューラルネットワークモデルと比較して最高の予測スコアを持っていることも確認しました。最後に、このモデルは時空間顕著性予測にも適用でき、パフォーマンスが向上します。
Visual attention is one of the most significant characteristics for selecting and understanding the outside redundancy world. The nature complex scenes, including larger redundancy and human vision, cannot be processing all information simultaneously because of the information bottleneck. The human visual system mainly focuses on dominant parts of the scenes to reduce the input visual redundancy information. It is commonly known as visual attention prediction or visual saliency map. This paper proposes a new saliency prediction architecture WECSF which inspired by human low-level visual cortex function. The model consists of opponent color channels, wavelet transform, wavelet energy map, and contrast sensitivity function for extracting low-level image features and maximum approximation to the human visual system. The proposed model is evaluated several datasets, including MIT1003, MIT300, TORONTO, SID4VAM and UCF Sports dataset to explain its efficiency. The proposed model results are quantitatively and qualitatively compared to other state-of-the-art salience prediction models. Compared with the baseline model, our model achieved very good performance. Secondly, we also confirmed Fourier/Spectral inspired saliency prediction models has the best prediction scores compared to other start-of-the-art non-neural network and even deep neural network models on the simple image features saliency prediction. Finally, the model also can be applied to spatial-temporal saliency prediction and got better performance.