arXiv reaDer
V1の顕著性予測のニューロダイナミックモデル
A Neurodynamic model of Saliency prediction in V1
一次視覚皮質(V1)の側方結合は、輝度誘導、色誘導、視覚的不快感、ボトムアップ視覚注意(顕著性とも呼ばれる)などのいくつかの視覚処理メカニズムの原因であると長い間仮定されてきました。多くの計算モデルは、これらおよび他の視覚プロセスを独立して予測するために開発されましたが、それらのすべてを同時に再現できる計算モデルはありません。この研究では、V1の側方相互作用の生物学的にもっともらしい計算モデルが顕著性と前述のすべての視覚プロセスを同時に予測できることを示しています。私たちのモデル(NSWAM)のアーキテクチャは、V1の横方向接続のPennachioのニューロダイナミックモデルに基づいています。発火率ニューロンのネットワークとして定義され、明るさ、色、向き、スケールなどの視覚的特徴に敏感です。いくつかのアイトラッキングデータセットの画像を使用して、NSWAM顕著性予測をテストしました。私たちのアーキテクチャーによって得られた、シャッフルされたメトリックを使用した予測の精度は、特に低レベルの機能を主に含む合成画像(CAT2000-Pattern&SID4VAM)で、他の最先端の計算方法と同様であることを示します。さらに、顕著性のみを再現するように特別に設計された、他の生物学にヒントを得た顕著性モデルよりも優れています。したがって、側方結合の生物学的にもっともらしいモデルがV1に存在するさまざまな視覚プロセスを同時に説明できることを示します(トレーニングまたは最適化のタイプを適用せず、すべての視覚プロセスに同じパラメーター化を維持しません)。これは、一次視覚皮質の統合アーキテクチャの定義に役立ちます。
Lateral connections in the primary visual cortex (V1) have long been hypothesized to be responsible of several visual processing mechanisms such as brightness induction, chromatic induction, visual discomfort and bottom-up visual attention (also named saliency). Many computational models have been developed to independently predict these and other visual processes, but no computational model has been able to reproduce all of them simultaneously. In this work we show that a biologically plausible computational model of lateral interactions of V1 is able to simultaneously predict saliency and all the aforementioned visual processes. Our model's (NSWAM) architecture is based on Pennachio's neurodynamic model of lateral connections of V1. It is defined as a network of firing rate neurons, sensitive to visual features such as brightness, color, orientation and scale. We tested NSWAM saliency predictions using images from several eye tracking datasets. We show that accuracy of predictions, using shuffled metrics, obtained by our architecture is similar to other state-of-the-art computational methods, particularly with synthetic images (CAT2000-Pattern & SID4VAM) which mainly contain low level features. Moreover, we outperform other biologically-inspired saliency models that are specifically designed to exclusively reproduce saliency. Hence, we show that our biologically plausible model of lateral connections can simultaneously explain different visual proceses present in V1 (without applying any type of training or optimization and keeping the same parametrization for all the visual processes). This can be useful for the definition of a unified architecture of the primary visual cortex.
updated: Fri Sep 18 2020 20:36:01 GMT+0000 (UTC)
published: Thu Nov 15 2018 12:11:24 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト