arXiv reaDer
ダウンサンプリングされた不変性損失と条件付きブラインド スポット ネットワークを使用した自己教師あり画像のノイズ除去
Self-supervised Image Denoising with Downsampled Invariance Loss and Conditional Blind-Spot Network
ディープ ニューラル ネットワークを使用した多くの画像デノイザーがあり、従来のモデルベースの方法よりも大幅に優れています。最近、教師ありトレーニング用の大規模な実際のノイズ データセットを構築することは非常に負担が大きいため、自己教師あり方法が注目を集めています。最も代表的な自己教師ありデノイザーは、受容野の中心ピクセルを除外する盲点ネットワークに基づいています。ただし、入力ピクセルを除外すると、特に対応する出力位置の入力ピクセルが除外される場合に、一部の情報が破棄されます。さらに、標準的なブラインド スポット ネットワークは、独立して分散された合成ノイズをうまく除去できますが、ノイズのピクセル単位の相関により、実際のカメラ ノイズを減らすことができません。したがって、より実用的なノイズ除去を実現するために、実際のノイズを除去できる新しい自己教師ありトレーニング フレームワークを提案します。このために、ネットワークがダウンサンプリングされたブラインド出力によって導かれる場合の教師付き損失の理論的な上限を導き出します。また、中央のピクセル情報を使用してネットワークのブラインドネスを選択的に制御する条件付きブラインド スポット ネットワーク (C-BSN) を設計します。さらに、ランダム サブサンプラーを利用してノイズを空間的に無相関化し、C-BSN にダウンサンプル ベースの方法でよく見られる視覚的なアーティファクトがないようにします。広範な実験により、提案された C-BSN は、実世界のデータセットで自己教師ありデノイザーとして最先端のパフォーマンスを達成し、後処理や改良なしで質的に満足のいく結果を示すことが示されています。
There have been many image denoisers using deep neural networks, which outperform conventional model-based methods by large margins. Recently, self-supervised methods have attracted attention because constructing a large real noise dataset for supervised training is an enormous burden. The most representative self-supervised denoisers are based on blind-spot networks, which exclude the receptive field's center pixel. However, excluding any input pixel is abandoning some information, especially when the input pixel at the corresponding output position is excluded. In addition, a standard blind-spot network fails to reduce real camera noise due to the pixel-wise correlation of noise, though it successfully removes independently distributed synthetic noise. Hence, to realize a more practical denoiser, we propose a novel self-supervised training framework that can remove real noise. For this, we derive the theoretic upper bound of a supervised loss where the network is guided by the downsampled blinded output. Also, we design a conditional blind-spot network (C-BSN), which selectively controls the blindness of the network to use the center pixel information. Furthermore, we exploit a random subsampler to decorrelate noise spatially, making the C-BSN free of visual artifacts that were often seen in downsample-based methods. Extensive experiments show that the proposed C-BSN achieves state-of-the-art performance on real-world datasets as a self-supervised denoiser and shows qualitatively pleasing results without any post-processing or refinement.
updated: Wed Apr 19 2023 08:55:27 GMT+0000 (UTC)
published: Wed Apr 19 2023 08:55:27 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト