arXiv reaDer
FaDIV-Syn:深度に依存しない高速ビュー合成
FaDIV-Syn: Fast Depth-Independent View Synthesis
深度に依存しない高速ビュー合成方法であるFaDIV-Synを紹介します。私たちのマルチビューアプローチは、ビュー合成方法が深度推定段階によって制限されることが多いという問題に対処します。この段階では、深度予測が正しくないと、大きな投影エラーが発生する可能性があります。この問題を回避するために、想定される深度平面の範囲で、複数の入力画像をターゲットフレームに効率的にワープします。結果のテンソル表現は、ゲート畳み込みを備えたU-NetのようなCNNに送られ、新しい出力ビューが直接生成されます。したがって、明示的な深度推定を回避します。これにより、透明、反射、機能のないシーンパーツの効率とパフォーマンスが向上します。 FaDIV-Synは、内挿タスクと外挿タスクの両方を処理でき、大規模なRealEstate10kデータセットの最先端の外挿法よりも優れています。同等の方法とは対照的に、軽量アーキテクチャによりリアルタイム操作が可能です。さらに、FaDIV-Synのデータ効率を、より少ない例からトレーニングし、厳しい深度離散化の下でより高い解像度と任意の深度範囲に一般化することによって示します。
We introduce FaDIV-Syn, a fast depth-independent view synthesis method. Our multi-view approach addresses the problem that view synthesis methods are often limited by their depth estimation stage, where incorrect depth predictions can lead to large projection errors. To avoid this issue, we efficiently warp multiple input images into the target frame for a range of assumed depth planes. The resulting tensor representation is fed into a U-Net-like CNN with gated convolutions, which directly produces the novel output view. We therefore side-step explicit depth estimation. This improves efficiency and performance on transparent, reflective, and feature-less scene parts. FaDIV-Syn can handle both interpolation and extrapolation tasks and outperforms state-of-the-art extrapolation methods on the large-scale RealEstate10k dataset. In contrast to comparable methods, it is capable of real-time operation due to its lightweight architecture. We further demonstrate data efficiency of FaDIV-Syn by training from fewer examples as well as its generalization to higher resolutions and arbitrary depth ranges under severe depth discretization.
updated: Thu Jun 24 2021 16:14:01 GMT+0000 (UTC)
published: Thu Jun 24 2021 16:14:01 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト