狭い視野のLDRカメラ画像からHDR環境マップをリアルタイムで推定する方法を紹介します。これにより、ミラーから拡散まで、拡張現実を使用して実際の物理環境にレンダリングされた、あらゆるマテリアル仕上げの仮想オブジェクトで知覚的に魅力的な反射とシェーディングが可能になります。私たちの方法は、効率的な畳み込みニューラルネットワークアーキテクチャであるEnvMapNetに基づいており、生成された画像のProjectionLossと敵対者のトレーニングのClusterLossという2つの新しい損失でエンドツーエンドでトレーニングされています。最先端の方法との定性的および定量的な比較を通じて、アルゴリズムが推定光源の方向誤差を50%以上削減し、フレシェ開始距離(FID)を3.7分の1に達成することを示します。さらに、iPhone XSで9ミリ秒未満でニューラルネットワークモデルを実行し、これまで見られなかった現実の環境でリアルタイムの視覚的にコヒーレントな仮想オブジェクトをレンダリングできるモバイルアプリケーションを紹介します。
We present a method to estimate an HDR environment map from a narrow field-of-view LDR camera image in real-time. This enables perceptually appealing reflections and shading on virtual objects of any material finish, from mirror to diffuse, rendered into a real physical environment using augmented reality. Our method is based on our efficient convolutional neural network architecture, EnvMapNet, trained end-to-end with two novel losses, ProjectionLoss for the generated image, and ClusterLoss for adversarial training. Through qualitative and quantitative comparison to state-of-the-art methods, we demonstrate that our algorithm reduces the directional error of estimated light sources by more than 50%, and achieves 3.7 times lower Frechet Inception Distance (FID). We further showcase a mobile application that is able to run our neural network model in under 9 ms on an iPhone XS, and render in real-time, visually coherent virtual objects in previously unseen real-world environments.