デジタル画像技術の主な目標は、シーンのリアルな外観を再現することです。低ダイナミックレンジ(LDR)カメラは、実世界のシーンのワイドダイナミックレンジを表現することはできません。キャプチャされた画像は、暗すぎる(露出不足)か明るすぎる(露出過多)かのいずれかであることがわかります。具体的には、露出過度の領域での飽和により、単一のLDR画像からハイダイナミックレンジ(HDR)画像を再構築する作業が困難になります。この論文では、HDR画像を再構築しながら飽和領域の詳細を復元するための深層学習ベースのアプローチを提案します。この問題を画像から画像(I2I)への変換タスクとして定式化します。この目的のために、HDR-REALおよびHDR-SYNTHデータセット上でエンドツーエンドの方法でトレーニングされた新しい条件付きGAN(cGAN)ベースのフレームワークを提示します。私たちのフレームワークは、事前にトレーニングされたセグメンテーションモデルから取得した露出過度のマスクを使用して、飽和領域に詳細を追加する幻覚タスクを容易にします。いくつかの最先端の単一画像HDR再構成技術との広範な定量的および定性的比較を実行することにより、提案された方法の有効性を示します。
The prime goal of digital imaging techniques is to reproduce the realistic appearance of a scene. Low Dynamic Range (LDR) cameras are incapable of representing the wide dynamic range of the real-world scene. The captured images turn out to be either too dark (underexposed) or too bright (overexposed). Specifically, saturation in overexposed regions makes the task of reconstructing a High Dynamic Range (HDR) image from single LDR image challenging. In this paper, we propose a deep learning based approach to recover details in the saturated areas while reconstructing the HDR image. We formulate this problem as an image-to-image (I2I) translation task. To this end, we present a novel conditional GAN (cGAN) based framework trained in an end-to-end fashion over the HDR-REAL and HDR-SYNTH datasets. Our framework uses an overexposed mask obtained from a pre-trained segmentation model to facilitate the hallucination task of adding details in the saturated regions. We demonstrate the effectiveness of the proposed method by performing an extensive quantitative and qualitative comparison with several state-of-the-art single-image HDR reconstruction techniques.