arXiv reaDer
幾何学的マッチングの一貫した観点からオプティカル フローを再考する
Rethinking Optical Flow from Geometric Matching Consistent Perspective
オプティカル フローの推定は、未解決のままの難しい問題です。最近の深層学習ベースのオプティカル フロー モデルは、かなりの成功を収めています。ただし、これらのモデルは、多くの場合、標準のオプティカル フロー データを使用してゼロからネットワークをトレーニングするため、画像の特徴を堅牢かつ幾何学的に一致させる能力が制限されます。本稿では、以前のオプティカル フロー推定の再考を提案します。 GIM は、オプティカル フロー推定としていくつかの一般的な課題を共有し、大規模なラベル付けされた現実世界のデータを使用するため、特に、ジオメトリック イメージ マッチング (GIM) をオプティカル フロー推定 (MatchFlow) の事前トレーニング タスクとして活用します。したがって、静的シーンのマッチングは、オブジェクトとシーンのより基本的な特徴の相関関係を一貫した変位で学習するのに役立ちます。具体的には、提案されたMatchFlowモデルは、MegaDepthで事前トレーニングされたQuadTreeアテンションベースのネットワークを採用して、さらなるフロー回帰のために粗い特徴を抽出します。広範な実験により、私たちのモデルには優れたクロスデータセットの一般化があることが示されています。私たちの方法は、Sintel クリーン パスおよび KITTI テスト セットで GMA から 11.5% および 10.1% のエラー削減を達成します。匿名で提出された時点で、私たちの MatchFlow(G) は、Sintel のクリーン パスと最終パスで、同等の計算とメモリ フットプリントを持つ公開されたアプローチと比較して、最先端のパフォーマンスを享受しています。コードとモデルは https://github.com/DQiaole/MatchFlow で公開されます。
Optical flow estimation is a challenging problem remaining unsolved. Recent deep learning based optical flow models have achieved considerable success. However, these models often train networks from the scratch on standard optical flow data, which restricts their ability to robustly and geometrically match image features. In this paper, we propose a rethinking to previous optical flow estimation. We particularly leverage Geometric Image Matching (GIM) as a pre-training task for the optical flow estimation (MatchFlow) with better feature representations, as GIM shares some common challenges as optical flow estimation, and with massive labeled real-world data. Thus, matching static scenes helps to learn more fundamental feature correlations of objects and scenes with consistent displacements. Specifically, the proposed MatchFlow model employs a QuadTree attention-based network pre-trained on MegaDepth to extract coarse features for further flow regression. Extensive experiments show that our model has great cross-dataset generalization. Our method achieves 11.5% and 10.1% error reduction from GMA on Sintel clean pass and KITTI test set. At the time of anonymous submission, our MatchFlow(G) enjoys state-of-the-art performance on Sintel clean and final pass compared to published approaches with comparable computation and memory footprint. Codes and models will be released in https://github.com/DQiaole/MatchFlow.
updated: Wed Mar 15 2023 06:00:38 GMT+0000 (UTC)
published: Wed Mar 15 2023 06:00:38 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト