深さ知覚の学習ベースのアプローチは、クリーントレーニングデータの可用性によって制限されます。これにより、効率的なデータ取得手順を使用して深度推定を学習するための間接的な目的として、ビュー合成が利用されるようになりました。それにもかかわらず、ほとんどの研究はピンホールベースの単眼視に焦点を当てており、全方位入力の結果を示す作品はほとんどありません。この作業では、単眼360深度を自己監視方式で学習するための球面ビュー合成を調査し、その実現可能性を示します。純粋に幾何学的に導出された定式化の下で、水平および垂直のベースラインと三眼の場合の結果を示します。さらに、正長方形領域に効率的な方法で適用した場合に、従来のCNNの表現力をより活用する方法を示します。最後に、グラウンドトゥルースの深度データが利用できることを考えると、私たちの作業は、ビュー合成と直接監督を一貫した公正な方法で比較する独自の位置にあります。結果は、より質の高い奥行き知覚を可能にするために、代替の研究方向がより適している可能性があることを示しています。データ、モデル、コードはhttps://vcl3d.github.io/SphericalViewSynthesis/で公開されています。
Learning based approaches for depth perception are limited by the availability of clean training data. This has led to the utilization of view synthesis as an indirect objective for learning depth estimation using efficient data acquisition procedures. Nonetheless, most research focuses on pinhole based monocular vision, with scarce works presenting results for omnidirectional input. In this work, we explore spherical view synthesis for learning monocular 360 depth in a self-supervised manner and demonstrate its feasibility. Under a purely geometrically derived formulation we present results for horizontal and vertical baselines, as well as for the trinocular case. Further, we show how to better exploit the expressiveness of traditional CNNs when applied to the equirectangular domain in an efficient manner. Finally, given the availability of ground truth depth data, our work is uniquely positioned to compare view synthesis against direct supervision in a consistent and fair manner. The results indicate that alternative research directions might be better suited to enable higher quality depth perception. Our data, models and code are publicly available at https://vcl3d.github.io/SphericalViewSynthesis/.