イメージングセンサーは、10〜12ビットのダイナミックレンジ(つまり、1024〜4096の階調値)で着信シーンライトをデジタル化します。次に、センサー画像はカメラで処理され、最終的に8ビット(つまり、256階調値)のみに量子化されて、一般的なエンコーディング標準に準拠します。高ビット深度のディスプレイや写真の編集など、失われたビット深度を回復することが有益な多くの重要なアプリケーションがあります。ディープニューラルネットワークは、このビット深度の再構築タスクで効果的です。入力として量子化された低ビット深度の画像が与えられた場合、既存のディープラーニング手法は、(1)高ビット深度の画像を直接推定するか、または(2)高ビット深度の残差を直接推定するシングルショットアプローチを採用します-低ビット深度の画像。対照的に、ビットプレーンごとの残差画像を回復するトレーニングおよび推論戦略を提案します。当社のビットプレーン単位の学習フレームワークには、トレーニング中に複数のレベルの監視が可能であり、シンプルなネットワークアーキテクチャを使用して最先端の結果を得ることができるという利点があります。提案した方法をいくつかの画像データセットで広範囲にテストし、量子化レベルに応じて、従来の方法よりもPSNRが0.5dBから2.3dBに向上することを示しています。
Imaging sensors digitize incoming scene light at a dynamic range of 10--12 bits (i.e., 1024--4096 tonal values). The sensor image is then processed onboard the camera and finally quantized to only 8 bits (i.e., 256 tonal values) to conform to prevailing encoding standards. There are a number of important applications, such as high-bit-depth displays and photo editing, where it is beneficial to recover the lost bit depth. Deep neural networks are effective at this bit-depth reconstruction task. Given the quantized low-bit-depth image as input, existing deep learning methods employ a single-shot approach that attempts to either (1) directly estimate the high-bit-depth image, or (2) directly estimate the residual between the high- and low-bit-depth images. In contrast, we propose a training and inference strategy that recovers the residual image bitplane-by-bitplane. Our bitplane-wise learning framework has the advantage of allowing for multiple levels of supervision during training and is able to obtain state-of-the-art results using a simple network architecture. We test our proposed method extensively on several image datasets and demonstrate an improvement from 0.5dB to 2.3dB PSNR over prior methods depending on the quantization level.