arXiv reaDer
AnyFlow: 暗黙的なニューラル表現による任意スケールのオプティカル フロー
AnyFlow: Arbitrary Scale Optical Flow with Implicit Neural Representation
オプティカル フローを実際に適用するには、計算コストを削減するために、入力をより小さな次元にサイズ変更する必要があることがよくあります。ただし、入力のサイズを小さくすると、オブジェクトとモーション レンジが小さくなるため、推定がより困難になります。最近のアプローチでは高品質のフロー推定が実証されていますが、入力解像度が低下すると、小さなオブジェクトと正確な境界を正確にモデル化できない傾向があり、高解像度入力への適用が制限されます。このホワイトペーパーでは、さまざまな解像度の画像から正確なフローを推定する堅牢なネットワークである AnyFlow を紹介します。オプティカル フローを連続的な座標ベースの表現として表すことにより、AnyFlow は低解像度の入力から任意のスケールで出力を生成し、広範囲のシーンで細部を保持しながら小さなオブジェクトをキャプチャする際に、以前の作業よりも優れたパフォーマンスを示します。オンライン ベンチマークで他の SOTA メソッドに匹敵する精度を達成しながら、KITTI データセットでのクロスデータセット一般化の新しい最先端のパフォーマンスを確立します。
To apply optical flow in practice, it is often necessary to resize the input to smaller dimensions in order to reduce computational costs. However, downsizing inputs makes the estimation more challenging because objects and motion ranges become smaller. Even though recent approaches have demonstrated high-quality flow estimation, they tend to fail to accurately model small objects and precise boundaries when the input resolution is lowered, restricting their applicability to high-resolution inputs. In this paper, we introduce AnyFlow, a robust network that estimates accurate flow from images of various resolutions. By representing optical flow as a continuous coordinate-based representation, AnyFlow generates outputs at arbitrary scales from low-resolution inputs, demonstrating superior performance over prior works in capturing tiny objects with detail preservation on a wide range of scenes. We establish a new state-of-the-art performance of cross-dataset generalization on the KITTI dataset, while achieving comparable accuracy on the online benchmarks to other SOTA methods.
updated: Wed Mar 29 2023 07:03:51 GMT+0000 (UTC)
published: Wed Mar 29 2023 07:03:51 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト