arXiv reaDer
運動不変性下での視覚的特徴の学習
Learning Visual Features Under Motion Invariance
 人間は、自然な時間構造を持つ視覚データのストリームに継続的にさらされています。ただし、成功しているほとんどのコンピュータビジョンアルゴリズムは画像レベルで機能し、動きによって運ばれる貴重な情報を完全に破棄します。この論文では、ビジュアルストリームを処理することで自然に運動不変性の原理が定式化され、物理学と同様に変分原理に基づく新しい学習理論を構築できると主張します。このような原理的なアプローチは、ビジョンで発生するいくつかの興味深い質問についての議論に適しています。網膜上の畳み込みフィルターを発見するための適切な計算スキームを提供します。大規模な監視が必要な従来のたたみ込みネットワークとは異なり、提案された理論は、ビデオ信号の監視なし処理のための真に新しいシナリオを提供し、モーション不変性を備えた多層アーキテクチャで特徴が抽出されます。この理論は新しいコンピュータビジョンシステムの実装を可能にする一方で、可能な生物学的ソリューションを推進するための情報に基づく原理の役割にも光を当てています。
Humans are continuously exposed to a stream of visual data with a natural temporal structure. However, most successful computer vision algorithms work at image level, completely discarding the precious information carried by motion. In this paper, we claim that processing visual streams naturally leads to formulate the motion invariance principle, which enables the construction of a new theory of learning that originates from variational principles, just like in physics. Such principled approach is well suited for a discussion on a number of interesting questions that arise in vision, and it offers a well-posed computational scheme for the discovery of convolutional filters over the retina. Differently from traditional convolutional networks, which need massive supervision, the proposed theory offers a truly new scenario for the unsupervised processing of video signals, where features are extracted in a multi-layer architecture with motion invariance. While the theory enables the implementation of novel computer vision systems, it also sheds light on the role of information-based principles to drive possible biological solutions.
updated: Fri Apr 24 2020 10:00:44 GMT+0000 (UTC)
published: Sun Sep 01 2019 08:20:44 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト