arXiv reaDer
学習可能な辞書を介したモデルベースの画像信号プロセッサ
Model-Based Image Signal Processors via Learnable Dictionaries
デジタルカメラは、画像信号プロセッサ(ISP)を使用して、センサーのRAW読み取り値をRGB画像に変換します。画像のノイズ除去や色覚恒常などの計算写真タスクは、RAWドメインで一般的に実行されます。これは、固有のハードウェア設計が原因の1つですが、センサーの直接読み取りから得られるノイズ統計の魅力的な単純さも原因です。それにもかかわらず、RAW画像の利用可能性は、利用可能なRGBデータの豊富さと多様性に比べて制限されています。最近のアプローチでは、RGBからRAWへのマッピングを推定することでこのギャップを埋めようとしています。解釈可能で制御可能な手作りのモデルベースの方法では、通常、手動でパラメータを微調整する必要がありますが、エンドツーエンドの学習可能なニューラルネットワークでは大量のトレーニングデータが必要です。複雑なトレーニング手順を伴う場合があり、一般に解釈可能性とパラメータ制御が不足しています。これらの既存の制限に対処するために、標準的なISP運用に基づいて構築され、学習可能で解釈可能な新しいハイブリッドモデルベースおよびデータ駆動型ISPを紹介します。 RAWドメインとRGBドメイン間の双方向マッピングが可能な、提案された可逆モデルは、直接的なパラメトリック監視がなく、さらに単純でもっともらしいデータ拡張を可能にする、豊富なパラメーター表現、つまり辞書のエンドツーエンドの学習を採用しています。 RAW画像の再構築とRAW画像のノイズ除去タスクの両方での広範な実験により、データ生成プロセスの価値を証明し、両方で最先端のパフォーマンスを実現します。さらに、ISPが少数のデータサンプルから意味のあるマッピングを学習できること、および辞書ベースのデータ拡張でトレーニングされたノイズ除去モデルが、グラウンドトゥルースラベルが少ないかゼロであるにもかかわらず競争力があることを示します。
Digital cameras transform sensor RAW readings into RGB images by means of their Image Signal Processor (ISP). Computational photography tasks such as image denoising and colour constancy are commonly performed in the RAW domain, in part due to the inherent hardware design, but also due to the appealing simplicity of noise statistics that result from the direct sensor readings. Despite this, the availability of RAW images is limited in comparison with the abundance and diversity of available RGB data. Recent approaches have attempted to bridge this gap by estimating the RGB to RAW mapping: handcrafted model-based methods that are interpretable and controllable usually require manual parameter fine-tuning, while end-to-end learnable neural networks require large amounts of training data, at times with complex training procedures, and generally lack interpretability and parametric control. Towards addressing these existing limitations, we present a novel hybrid model-based and data-driven ISP that builds on canonical ISP operations and is both learnable and interpretable. Our proposed invertible model, capable of bidirectional mapping between RAW and RGB domains, employs end-to-end learning of rich parameter representations, i.e. dictionaries, that are free from direct parametric supervision and additionally enable simple and plausible data augmentation. We evidence the value of our data generation process by extensive experiments under both RAW image reconstruction and RAW image denoising tasks, obtaining state-of-the-art performance in both. Additionally, we show that our ISP can learn meaningful mappings from few data samples, and that denoising models trained with our dictionary-based data augmentation are competitive despite having only few or zero ground-truth labels.
updated: Mon Jan 10 2022 08:36:10 GMT+0000 (UTC)
published: Mon Jan 10 2022 08:36:10 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト