arXiv reaDer
ローカルコンテンツのベクトル表現とローカルモーションのマトリックス表現を使用したV1単純細胞の学習
Learning V1 Simple Cells with Vector Representation of Local Content and Matrix Representation of Local Motion
この論文は、モデルが一次視覚野(V1)の運動知覚に光を当てることを期待して、局所的なピクセル変位によって関連付けられる連続ビデオフレームなどの画像ペアの表現モデルを提案します。このモデルは、次の2つのコンポーネントを結合します。(1)画像のローカルコンテンツのベクトル表現と(2)3Dシーン内のエージェントとオブジェクト間の相対運動によって引き起こされるローカルピクセル変位のマトリックス表現。画像フレームが局所的なピクセル変位によって変化する場合、ベクトルは局所的な変位を表す行列で乗算されます。したがって、ベクトル表現は、局所的な変位に応じて変化するため、同変です。私たちの実験は、私たちのモデルが直交位相のGaborのようなフィルターペアを学習できることを示しています。学習したフィルターのプロファイルは、MacaqueV1の単純細胞のプロファイルと一致します。さらに、モデルが教師ありまたは教師なしの方法で局所運動を推測することを学習できることを示します。このような単純なモデルで、オプティカルフロー推定で競争力のある結果を達成します。
This paper proposes a representational model for image pairs such as consecutive video frames that are related by local pixel displacements, in the hope that the model may shed light on motion perception in primary visual cortex (V1). The model couples the following two components: (1) the vector representations of local contents of images and (2) the matrix representations of local pixel displacements caused by the relative motions between the agent and the objects in the 3D scene. When the image frame undergoes changes due to local pixel displacements, the vectors are multiplied by the matrices that represent the local displacements. Thus the vector representation is equivariant as it varies according to the local displacements. Our experiments show that our model can learn Gabor-like filter pairs of quadrature phases. The profiles of the learned filters match those of simple cells in Macaque V1. Moreover, we demonstrate that the model can learn to infer local motions in either a supervised or unsupervised manner. With such a simple model, we achieve competitive results on optical flow estimation.
updated: Wed Apr 06 2022 01:31:28 GMT+0000 (UTC)
published: Thu Jan 24 2019 08:09:19 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト