360枚の画像は、考えられるあらゆる方向で撮影されたシーンを表し、視聴者がシーン内を自由にナビゲートできるようにして、没入感のある体験を提供します。逆に、従来の画像は、視界が狭い(FOV)の単一の視線方向のシーンを表します。その結果、シーンの特定の部分のみが観察され、周囲に関する貴重な情報が失われます。このペーパーでは、従来の画像のスパースセット(通常は4つの画像)から360 x 180のシーンを再構築する学習ベースのアプローチを提案します。提案されたアプローチでは、まずパノラマに関連する入力画像のFOVを推定します。推定されたFOVは、高解像度360パノラマ出力を合成するための事前条件として使用されます。提案された方法は、高解像度画像(512 x 1024まで)の合成における学習ベースのアプローチの難しさを克服します。実験結果は、提案された方法が妥当な品質の360パノラマを生成することを示しています。結果は、提案された方法が代替方法よりも優れており、非パノラマシーンやスマートフォンのカメラで撮影された画像に対して一般化できることも示しています。
360 images represent scenes captured in all possible viewing directions and enable viewers to navigate freely around the scene thereby providing an immersive experience. Conversely, conventional images represent scenes in a single viewing direction with a small or limited field of view (FOV). As a result, only certain parts of the scenes are observed, and valuable information about the surroundings is lost. In this paper, a learning-based approach that reconstructs the scene in 360 x 180 from a sparse set of conventional images (typically 4 images) is proposed. The proposed approach first estimates the FOV of input images relative to the panorama. The estimated FOV is then used as the prior for synthesizing a high-resolution 360 panoramic output. The proposed method overcomes the difficulty of learning-based approach in synthesizing high resolution images (up to 512×1024). Experimental results demonstrate that the proposed method produces 360 panorama with reasonable quality. Results also show that the proposed method outperforms the alternative method and can be generalized for non-panoramic scenes and images captured by a smartphone camera.