The two-dimensional Gabor function adapted to natural image statistics: A model of simple-cell receptive fields and sparse structure in images
2次元のガボール関数は自然画像の統計に適応し、扱いやすい確率生成モデルにつながります。この生成モデルを使用して、シンプルセルの受容野プロファイルをモデル化したり、スパースコーディングアプリケーションの基底関数を生成したりできます。学習は、2次元ガボール関数のサイズと空間周波数を表す3つのガボール関数パラメーターで最も顕著であり、裾が重い不均一な確率分布によって特徴付けられます。 3つのパラメーターすべてが強く相関していることがわかります。結果として、同様のアスペクト比とサイズに依存する空間周波数を持つマルチスケールGabor関数の基礎が得られます。重要な発見は、受容野サイズの分布が広範囲の値にわたってスケール不変であるため、自然画像統計によって選択された特徴的な受容野サイズがないことです。ガボール関数のアスペクト比は、学習ルールによってほぼ保存されていることがわかっているため、自然画像統計では十分に決定されません。これにより、3つの異なるソリューションが可能になります。空間周波数解像度を犠牲にして、シャープな方向解像度を持つガボール関数の基礎。方位分解能を犠牲にして鋭い空間周波数分解能を持つガボール関数の基礎。または単位アスペクト比の基礎。 3つのケースすべての任意の混合も可能です。確率的生成モデルの周辺分布の形状を制御する2つのパラメーターは、3つのソリューションすべてを完全に説明します。スパースコーディングアプリケーションの最も優れた確率的生成モデルは、パレート限界確率密度関数をもつガウスコピュラであることがわかります。
The two-dimensional Gabor function is adapted to natural image statistics, leading to a tractable probabilistic generative model that can be used to model simple-cell receptive-field profiles, or generate basis functions for sparse coding applications. Learning is found to be most pronounced in three Gabor-function parameters representing the size and spatial frequency of the two-dimensional Gabor function, and characterized by a non-uniform probability distribution with heavy tails. All three parameters are found to be strongly correlated: resulting in a basis of multiscale Gabor functions with similar aspect ratios, and size-dependent spatial frequencies. A key finding is that the distribution of receptive-field sizes is scale-invariant over a wide range of values, so there is no characteristic receptive-field size selected by natural image statistics. The Gabor-function aspect ratio is found to be approximately conserved by the learning rules and is therefore not well-determined by natural image statistics. This allows for three distinct solutions: a basis of Gabor functions with sharp orientation resolution at the expense of spatial-frequency resolution; a basis of Gabor functions with sharp spatial-frequency resolution at the expense of orientation resolution; or a basis with unit aspect ratio. Arbitrary mixtures of all three cases are also possible. Two parameters controlling the shape of the marginal distributions in a probabilistic generative model fully account for all three solutions. The best-performing probabilistic generative model for sparse coding applications is found to be a Gaussian copula with Pareto marginal probability density functions.
updated: Mon Jun 22 2020 00:57:00 GMT+0000 (UTC)
published: Fri Mar 29 2013 20:39:53 GMT+0000 (UTC)
