畳み込みニューラルネットワーク(CNN)は、画像の生成、回復、復元のための非常に成功したツールとして登場しました。この成功の主な要因は、畳み込みネットワークが自然画像について強い事前仮定を課すことです。このアーキテクチャの自然画像へのバイアスを強調する驚くべき実験は、ランダムに初期化され、パラメータ化された畳み込みジェネレータを破損画像に単純にフィットさせることにより、トレーニングデータを使用せずに自然画像からノイズと破損を除去できることです。この過剰にパラメーター化されたネットワークは破損した画像に完全に適合することができますが、驚くべきことに、勾配降下を数回繰り返した後、ほとんど破損していない画像が生成されます。この興味深い現象により、最新のCNNベースのノイズ除去と他の逆問題の正則化が可能になります。この論文では、この効果を畳み込みネットワークの特定のアーキテクチャ上の選択、つまり固定補間フィルタを使用した畳み込みに起因すると考えています。次に、2層の畳み込み発生器をノイズの多い信号に適合させるダイナミクスを正式に特性化し、早期停止勾配降下がノイズ除去/正規化することを証明します。私たちの証明は、畳み込みジェネレーターが、破損した部分よりもかなり速く画像の構造化された部分に適合することを示すことに依存しています。
Convolutional Neural Networks (CNNs) have emerged as highly successful tools for image generation, recovery, and restoration. A major contributing factor to this success is that convolutional networks impose strong prior assumptions about natural images. A surprising experiment that highlights this architectural bias towards natural images is that one can remove noise and corruptions from a natural image without using any training data, by simply fitting (via gradient descent) a randomly initialized, over-parameterized convolutional generator to the corrupted image. While this over-parameterized network can fit the corrupted image perfectly, surprisingly after a few iterations of gradient descent it generates an almost uncorrupted image. This intriguing phenomenon enables state-of-the-art CNN-based denoising and regularization of other inverse problems. In this paper, we attribute this effect to a particular architectural choice of convolutional networks, namely convolutions with fixed interpolating filters. We then formally characterize the dynamics of fitting a two-layer convolutional generator to a noisy signal and prove that early-stopped gradient descent denoises/regularizes. Our proof relies on showing that convolutional generators fit the structured part of an image significantly faster than the corrupted portion.