arXiv reaDer
カメラ画像信号処理のための深い対照パッチベースの部分空間学習
Deep Contrastive Patch-Based Subspace Learning for Camera Image Signal Processing
ディープラーニングのトレーニング済みバージョンを含むカメラ画像信号処理(ISP)パイプラインは、さまざまな画像信号処理タスクで魅力的な結果を得ることができます。ただし、これらの方法のすべてではないにしても、ほとんどの場合、画像全体に均一な単一のフィルターを適用する傾向があります。これは、エンコーダ-デコーダタイプのディープアーキテクチャがタスク用にトレーニングされている場合にも特に当てはまります。ただし、単一画像の2次元領域全体でさえ、色の強度と人工ノイズが大きく異なるため、カメラ画像を不均一であると見なすのは自然なことです。さまざまなモアレリンギング、モーションブラー、カラーブリーチ、またはレンズベースの投影歪みはすべて、不均一な画像アーティファクトフィルタリングの問題を引き起こす可能性があります。このホワイトペーパーでは、特定のパッチベースのローカル部分空間ディープニューラルネットワークを紹介します。これにより、Camera ISPが異種のアーティファクト(特に画像のノイズ除去)に対して堅牢になります。 3倍の深層訓練モデルをパッチ部分空間学習オートエンコーダー(PSL-AE)と呼びます。 PSL-AEは、必ずしも均一な画像の歪みレベルや、画像内で繰り返される類似のアーティファクトタイプを想定しているわけではありません。むしろ、PSL-AEは、対照的な学習によって、ノイズの多いクリーンな画像ペアから抽出されたパッチを、異なるアーティファクトタイプと歪みレベルで最初に診断的にエンコードします。次に、各画像のパッチは、以前の混合モデルを使用して、適切な潜在部分空間のソフトクラスターにエンコードされます。最後に、PSL-AEのデコーダーも、各ソフトクラスターのイメージパッチ用にカスタマイズされた教師なしの方法でトレーニングされます。私たちの実験結果は、合成されたアーティファクトだけでなく、現実的なSIDD画像ペアの両方から、改良された異種フィルタリングによって達成できる柔軟性とパフォーマンスを示しています。
Camera Image Signal Processing(ISP) pipelines, including deep learning trained versions, can get appealing results in different image signal processing tasks. However, most if not all of these methods tend to apply a single filter that is homogeneous over the entire image. This is also particularly true when an encoder-decoder type deep architecture is trained for the task. However, it is natural to view a camera image as heterogeneous, as the color intensity and the artificial noise are distributed vastly different, even across the two dimensional domain of a single image. Varied Moire ringing, motion-blur, color-bleaching or lens based projection distortions can all potentially lead to a heterogeneous image artifact filtering problem. In this paper, we present a specific patch-based, local subspace deep neural network that improves Camera ISP to be robust to heterogeneous artifacts (especially image denoising). We call our three-fold deep trained model the Patch Subspace Learning Autoencoder (PSL-AE). PSL-AE does not necessarily assume uniform image distortion levels nor repeated nor similar artifact types within the image. Rather, PSL-AE first diagnostically encodes patches extracted from noisy and clean image pairs, with different artifact type and distortion levels, by contrastive learning. Then, each image's patches are encoded into soft-clusters in their appropriate latent sub-space, using a prior mixture model. Lastly, the decoders of the PSL-AE are also trained in an unsupervised manner customized for the image patches in each soft-cluster. Our experimental results demonstrates the flexibility and performance that one can achieve through improved heterogeneous filtering, both from synthesized artifacts but also realistic SIDD image pairs.
updated: Wed Jul 06 2022 03:21:45 GMT+0000 (UTC)
published: Thu Apr 01 2021 04:40:22 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト