arXiv reaDer
自然なビデオの極予測
Polar Prediction of Natural Videos
オブザーバーの動きとオブジェクトとサーフェスの連続的な変形により、自然なビデオに明確な時間構造が吹き込まれ、過去のフレームから将来のフレームの部分的な予測が可能になります。従来の方法では、最初にローカル モーションまたはオプティック フローを推定し、それを使用してコンテンツをワープまたはコピーすることで将来のフレームを予測します。ここでは、より直接的な方法論を探ります。この方法論では、各フレームが、時間的進化の構造により容易にアクセスできる学習表現空間にマッピングされます。フーリエ シフト定理の幾何学とその群論的一般化に動機付けられて、学習したローカル極座標でビデオ フレームを表す単純なアーキテクチャを定式化します。具体的には、畳み込みチャネル係数のペアが複素数値として扱われ、ゆっくりと変化する振幅と直線的に進む位相で進化するように最適化されたネットワークを構築します。自然なビデオの次のフレーム予測でこれらのモデルをトレーニングし、そのパフォーマンスを、オプティック フローと予測ニューラル ネットワークを使用した従来の方法のパフォーマンスと比較します。極座標予測子は、解釈可能で高速でありながら、より優れたパフォーマンスを達成することがわかりました。これにより、自然なビデオ コンテンツを予測するためにエンドツーエンドでトレーニングされる、フローのないビデオ処理方法論の可能性が実証されました。
Observer motion and continuous deformations of objects and surfaces imbue natural videos with distinct temporal structures, enabling partial prediction of future frames from past ones. Conventional methods first estimate local motion, or optic flow, and then use it to predict future frames by warping or copying content. Here, we explore a more direct methodology, in which each frame is mapped into a learned representation space where the structure of temporal evolution is more readily accessible. Motivated by the geometry of the Fourier shift theorem and its group-theoretic generalization, we formulate a simple architecture that represents video frames in learned local polar coordinates. Specifically, we construct networks in which pairs of convolutional channel coefficients are treated as complex-valued, and are optimized to evolve with slowly varying amplitudes and linearly advancing phases. We train these models on next-frame prediction in natural videos, and compare their performance with that of conventional methods using optic flow as well as predictive neural networks. We find that the polar predictor achieves better performance while remaining interpretable and fast, thereby demonstrating the potential of a flow-free video processing methodology that is trained end-to-end to predict natural video content.
updated: Mon Mar 06 2023 19:00:59 GMT+0000 (UTC)
published: Mon Mar 06 2023 19:00:59 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト