arXiv reaDer
FaDIV-Syn:深度に依存しない高速ビュー合成
FaDIV-Syn: Fast Depth-Independent View Synthesis
新しいビュー合成のための高速な深度に依存しない方法であるFaDIV-Synを紹介します。関連する方法は、多くの場合、深度推定段階によって制限されます。この段階では、深度予測が正しくないと、大きな投影エラーが発生する可能性があります。この問題を回避するために、想定される深度平面の範囲で、入力画像をターゲットフレームに効率的にワープします。結果として得られる平面掃引ボリューム(PSV)は、ネットワークに直接供給されます。ネットワークは、最初に自己監視方式でソフトPSVマスクを推定し、次に新しい出力ビューを直接生成します。したがって、明示的な深度推定を回避します。これにより、透明、反射、薄型、機能のないシーンパーツの効率とパフォーマンスが向上します。 FaDIV-Synは、内挿と外挿の両方のタスクを実行でき、大規模なRealEstate10kデータセットで最先端の外挿法よりも優れています。同等の方法とは対照的に、軽量アーキテクチャによりリアルタイムのパフォーマンスを実現します。ソフトマスキングネットワークの削除、少数の例からのトレーニング、より高い解像度への一般化、より強力な深度離散化など、アブレーションを徹底的に評価します。
We introduce FaDIV-Syn, a fast depth-independent method for novel view synthesis. Related methods are often limited by their depth estimation stage, where incorrect depth predictions can lead to large projection errors. To avoid this issue, we efficiently warp input images into the target frame for a range of assumed depth planes. The resulting plane sweep volume (PSV) is directly fed into our network, which first estimates soft PSV masks in a self-supervised manner, and then directly produces the novel output view. We therefore side-step explicit depth estimation. This improves efficiency and performance on transparent, reflective, thin, and feature-less scene parts. FaDIV-Syn can perform both interpolation and extrapolation tasks and outperforms state-of-the-art extrapolation methods on the large-scale RealEstate10k dataset. In contrast to comparable methods, it achieves real-time performance due to its lightweight architecture. We thoroughly evaluate ablations, such as removing the Soft-Masking network, training from fewer examples as well as generalization to higher resolutions and stronger depth discretization.
updated: Tue Dec 14 2021 14:03:55 GMT+0000 (UTC)
published: Thu Jun 24 2021 16:14:01 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト