arXiv reaDer
コスト関数展開を使用した教師なしオプティカルフロー
Unsupervised Optical Flow Using Cost Function Unrolling
2つの連続する画像間の動きを分析することは、コンピュータービジョンの基本的なタスクの1つです。ラベル付けされたデータがない場合、損失関数は一貫性と滑らかさに分割され、自己管理型のトレーニングが可能になります。このホワイトペーパーでは、コスト関数の導出に焦点を当て、展開する反復アプローチを示し、ハードL1平滑性制約をよりソフトな多層反復スキームに変換します。より正確な勾配、特に非差分位置の近くでは、ネットワークの収束が改善され、テストされたシナリオで優れた結果が得られます。 MPISintelとKITTI2015の教師なしオプティカルフローベンチマークの両方に関する最先端の結果を報告します。提供されたアプローチは、提示されたパイプラインだけでなく、さまざまなアーキテクチャを強化するために使用できます。
Analyzing motion between two consecutive images is one of the fundamental tasks in computer vision. In the lack of labeled data, the loss functions are split into consistency and smoothness, allowing for self-supervised training. This paper focuses on the cost function derivation and presents an unrolling iterative approach, transferring the hard L1 smoothness constraint into a softer multi-layer iterative scheme. More accurate gradients, especially near non-differential positions, improve the network's convergence, providing superior results on tested scenarios. We report state-of-the-art results on both MPI Sintel and KITTI 2015 unsupervised optical flow benchmarks. The provided approach can be used to enhance various architectures and not limited just to the presented pipeline.
updated: Mon Nov 30 2020 14:10:03 GMT+0000 (UTC)
published: Mon Nov 30 2020 14:10:03 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト