この作業では、単一の単眼画像から始まる車両の新しいビューを合成するための、新しい自己監視型のセミパラメトリックアプローチを紹介します。パラメトリック(つまり、完全に学習ベース)の方法とは異なり、オブジェクトと3Dの世界に関するアプリオリの幾何学的な知識を、ディープラーニングベースの画像生成フレームワークに統合する方法を示します。この幾何学的コンポーネントは学習されないため、アプローチをセミパラメトリックと呼びます。特に、人工オブジェクトの対称性と区分的平面性を活用して、豊富なアプリオリな視覚情報を新しい視点合成プロセスに統合します。その後、画像補完ネットワーク(ICN)を訓練して、この幾何学的なガイダンスから現実的な画像を生成します。パラメトリックコンポーネントとノンパラメトリックコンポーネントのこの慎重なブレンドにより、i)実世界のシナリオで動作し、ii)テクスチャなどの高周波視覚情報を保持し、iii)入力の本当に任意の3Dロト変換を処理し、iv)完全に異なる3Dモデルへの形状転送を実行します。最終的に、私たちのアプローチは、合成データで簡単に補完でき、凹構造や穴(椅子など)が存在する場合でも、トポロジがまったく異なる他の剛体オブジェクトに拡張できることを示しています。最先端の競合他社に対する包括的な実験的分析は、定量的および知覚的な観点の両方からの本方法の有効性を示しています。補足資料、アニメーション結果、コード、およびデータは、https://github.com/ndrplz/semiparametricで入手できます。
In this work we introduce a new self-supervised, semi-parametric approach for synthesizing novel views of a vehicle starting from a single monocular image. Differently from parametric (i.e. entirely learning-based) methods, we show how a-priori geometric knowledge about the object and the 3D world can be successfully integrated into a deep learning based image generation framework. As this geometric component is not learnt, we call our approach semi-parametric. In particular, we exploit man-made object symmetry and piece-wise planarity to integrate rich a-priori visual information into the novel viewpoint synthesis process. An Image Completion Network (ICN) is then trained to generate a realistic image starting from this geometric guidance. This careful blend between parametric and non-parametric components allows us to i) operate in a real-world scenario, ii) preserve high-frequency visual information such as textures, iii) handle truly arbitrary 3D roto-translations of the input and iv) perform shape transfer to completely different 3D models. Eventually, we show that our approach can be easily complemented with synthetic data and extended to other rigid objects with completely different topology, even in presence of concave structures and holes (e.g. chairs). A comprehensive experimental analysis against state-of-the-art competitors shows the efficacy of our method both from a quantitative and a perceptive point of view. Supplementary material, animated results, code and data are available at: https://github.com/ndrplz/semiparametric