arXiv reaDer
CNNベースの検索モデルは、単純な視覚的特徴による注意ガイダンスを過小評価しています
CNN-based search model underestimates attention guidance by simple visual features
最近、張等。 (2018)オブジェクト認識のために畳み込みニューラルネットワークによって学習された視覚的特徴を使用する注意ガイダンスの興味深いモデルを提案しました。このモデルを、パフォーマンスの尺度として正確な検索実験に適合させました。以前に公開された機能と接続詞検索実験のシミュレーションにより、CNNベースの検索モデルは単純な視覚的機能による人間の注意ガイダンスをかなり過小評価していることが明らかになりました。簡単な説明は、モデルにはボトムアップの注意のガイダンスがないということです。別の見方としては、標準のCNNは人間のような注意ガイダンスに必要な機能を学習しないというものがあります。
Recently, Zhang et al. (2018) proposed an interesting model of attention guidance that uses visual features learnt by convolutional neural networks for object recognition. I adapted this model for search experiments with accuracy as the measure of performance. Simulation of our previously published feature and conjunction search experiments revealed that CNN-based search model considerably underestimates human attention guidance by simple visual features. A simple explanation is that the model has no bottom-up guidance of attention. Another view might be that standard CNNs do not learn features required for human-like attention guidance.
updated: Sun Apr 25 2021 18:57:46 GMT+0000 (UTC)
published: Mon Mar 29 2021 09:10:48 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト