頭部、目、視覚野を数値的に統合するコンフォーマルカメラの射影フーリエ変換(PFT)に関して著者が開発した双眼システムは、サッカードの眼球運動中に視覚情報を処理するために使用されます。眼球の最大速度700度/秒で1秒間に3つのサッカードを作成しますが、視覚システムはこれらの鋭い眼球運動を考慮して世界の安定した知覚を生成します。この視覚的恒常性は、サッカードの開始前に網膜のさまざまな組織化された皮質領域のニューロン受容野シフトによって維持され、眼球が到着する前にサッカードのターゲットからの視覚情報に脳がアクセスできるようにします。サッカード全体の視覚情報取得を統合します。モデリングでは、PFTの基本的な特性を利用します。第1に、PFTは、網膜構造に近い複素対数座標でFFTによって計算できます。第二に、フーリエ変換のシフト特性によってモデル化されたレチノトピック(対数)座標の変換は、サッカード前のシーンをサッカード後の参照フレームに再マッピングします。また、実験室での実験で被験者が観察したサッカード周辺の局在化の原因にもなります。モデリングには、共形幾何学、抽象および計算調和解析、計算視覚、視覚神経科学の学際的な領域が含まれるため、対応する背景資料を含め、これらの異なる領域が霊長類の知覚のモデリングにどのように絡み合っているかを解明します。特に、モデリングに関連する神経プロセスの基礎となる生理学的および行動的事実を提示します。また、コンフォーマルカメラのジオメトリを強調し、自然シーンの理解の中間レベルの視覚計算の側面でそれがどのようにユニークに役立つかについて説明します。
A binocular system developed by the author in terms of projective Fourier transform (PFT) of the conformal camera, which numerically integrates the head, eyes, and visual cortex, is used to process visual information during saccadic eye movements. Although we make three saccades per second at the eyeball's maximum speed of 700 deg/sec, our visual system accounts for these incisive eye movements to produce a stable percept of the world. This visual constancy is maintained by neuronal receptive field shifts in various retinotopically organized cortical areas prior to saccade onset, giving the brain access to visual information from the saccade's target before the eyes' arrival. It integrates visual information acquisition across saccades. Our modeling utilizes basic properties of PFT. First, PFT is computable by FFT in complex logarithmic coordinates that approximate the retinotopy. Second, a translation in retinotopic (logarithmic) coordinates, modeled by the shift property of the Fourier transform, remaps the presaccadic scene into a postsaccadic reference frame. It also accounts for the perisaccadic mislocalization observed by human subjects in laboratory experiments. Because our modeling involves cross-disciplinary areas of conformal geometry, abstract and computational harmonic analysis, computational vision, and visual neuroscience, we include the corresponding background material and elucidate how these different areas interwove in our modeling of primate perception. In particular, we present the physiological and behavioral facts underlying the neural processes related to our modeling. We also emphasize the conformal camera's geometry and discuss how it is uniquely useful in the intermediate-level vision computational aspects of natural scene understanding.