この論文では、モデルが一次視覚野(V1)の運動知覚に光を当てることを期待して、ローカルピクセル変位によって関連付けられた連続ビデオフレームなどの画像ペアの表現モデルを提案します。モデルは、次の2つのコンポーネントを結合します。 (1)画像のローカルコンテンツのベクトル表現。 (2)エージェントと3Dシーン内のオブジェクトとの間の相対的な動きによって引き起こされるローカルピクセル変位のマトリックス表現。画像フレームが局所的なピクセル変位により変化するとき、ベクトルは局所的な変位を表す行列で乗算されます。私たちの実験は、モデルが局所運動を推測することを学習できることを示しています。さらに、モデルは直交位相のガボールのようなフィルターペアを学習できます。
This paper proposes a representational model for image pair such as consecutive video frames that are related by local pixel displacements, in the hope that the model may shed light on motion perception in primary visual cortex (V1). The model couples the following two components. (1) The vector representations of local contents of images. (2) The matrix representations of local pixel displacements caused by the relative motions between the agent and the objects in the 3D scene. When the image frame undergoes changes due to local pixel displacements, the vectors are multiplied by the matrices that represent the local displacements. Our experiments show that our model can learn to infer local motions. Moreover, the model can learn Gabor-like filter pairs of quadrature phases.