全方向ビデオのオプティカル フロー推定は、2 つの重大な問題に直面しています。それは、ベンチマーク データセットの欠如と、全方向の性質に対応するために遠近法のビデオ ベースの方法を適応させるという課題です。この論文では、40 の異なるビデオと 4,000 のビデオ フレームを備えた、360 度の視野を持つ最初の知覚的に自然で合成的な全方向性ベンチマーク データセット FLOW360 を提案します。当社のデータセットと既存のオプティカル フロー データセットとの包括的な特性分析と比較を行い、知覚のリアリズム、独自性、多様性を明らかにします。全方向性に対応するために、全方向性フロー (SLOF) の新しいシャム表現学習フレームワークを提示します。コントラスト損失とオプティカル フロー損失を組み合わせたハイブリッド損失関数を使用して、ネットワークを対照的にトレーニングします。広範な実験により、提案されたフレームワークの有効性が検証され、最先端のアプローチよりも最大 40% のパフォーマンス向上が示されています。 FLOW360 データセットとコードは、https://siamlof.github.io/ で入手できます。
Optical flow estimation in omnidirectional videos faces two significant issues: the lack of benchmark datasets and the challenge of adapting perspective video-based methods to accommodate the omnidirectional nature. This paper proposes the first perceptually natural-synthetic omnidirectional benchmark dataset with a 360-degree field of view, FLOW360, with 40 different videos and 4,000 video frames. We conduct comprehensive characteristic analysis and comparisons between our dataset and existing optical flow datasets, which manifest perceptual realism, uniqueness, and diversity. To accommodate the omnidirectional nature, we present a novel Siamese representation Learning framework for Omnidirectional Flow (SLOF). We train our network in a contrastive manner with a hybrid loss function that combines contrastive loss and optical flow loss. Extensive experiments verify the proposed framework's effectiveness and show up to 40% performance improvement over the state-of-the-art approaches. Our FLOW360 dataset and code are available at https://siamlof.github.io/.