arXiv reaDer
事前の深い画像のスペクトルバイアスの測定と制御について
On Measuring and Controlling the Spectral Bias of the Deep Image Prior
以前の深い画像は、訓練されていないネットワークが、単一の劣化した画像を最適化することによって、ノイズ除去、修復、超解像などの逆イメージングの問題に対処できるという驚くべき能力を実証しました。その約束にもかかわらず、2つの制限があります。まず、ネットワークアーキテクチャの選択を超えて、事前にどのように制御できるかは不明なままです。次に、ピークに達した後にパフォーマンスが低下するため、最適化をいつ停止するかをオラクルが決定する必要があります。この論文では、これらの問題に対処するために、スペクトルバイアスの観点から事前に深い画像を研究します。周波数帯域対応測定を導入することにより、逆イメージングの深い画像の事前分布が最適化中にスペクトルバイアスを示すことを観察します。最適化では、低周波数の画像信号が高周波のノイズ信号よりも速く、よりよく学習されます。これは、最適化が適切なタイミングで停止されたときに、劣化した画像のノイズを除去したり、修復したりできる理由を正確に示しています。私たちの観察に基づいて、パフォーマンスの低下を防ぎ、最適化の収束を高速化する前に、深い画像のスペクトルバイアスを制御することを提案します。これは、インバースイメージングネットワークの2つのコアレイヤータイプである畳み込みレイヤーとアップサンプリングレイヤーで行います。畳み込みのリプシッツ制御アプローチとアップサンプリング層のガウス制御アプローチを示します。さらに、余分な計算を回避するための停止基準を導入します。ノイズ除去、修復、超解像に関する実験では、最適化中にパフォーマンスが低下することがなくなり、オラクル基準を早期に停止する必要がなくなりました。余分な計算を避けるために、停止基準の概要をさらに説明します。最後に、私たちのアプローチが、すべてのタスクにわたって、現在のアプローチと比較して好ましい回復結果を得るということを示します。
The deep image prior has demonstrated the remarkable ability that untrained networks can address inverse imaging problems, such as denoising, inpainting and super-resolution, by optimizing on just a single degraded image. Despite its promise, it suffers from two limitations. First, it remains unclear how one can control the prior beyond the choice of the network architecture. Second, it requires an oracle to determine when to stop the optimization as the performance degrades after reaching a peak. In this paper, we study the deep image prior from a spectral bias perspective to address these problems. By introducing a frequency-band correspondence measure, we observe that deep image priors for inverse imaging exhibit a spectral bias during optimization, where low-frequency image signals are learned faster and better than high-frequency noise signals. This pinpoints why degraded images can be denoised or inpainted when the optimization is stopped at the right time. Based on our observations, we propose to control the spectral bias in the deep image prior to prevent performance degradation and to speed up optimization convergence. We do so in the two core layer types of inverse imaging networks: the convolution layer and the upsampling layer. We present a Lipschitz-controlled approach for the convolution and a Gaussian-controlled approach for the upsampling layer. We further introduce a stopping criterion to avoid superfluous computation. The experiments on denoising, inpainting and super-resolution show that our method no longer suffers from performance degradation during optimization, relieving us from the need for an oracle criterion to stop early. We further outline a stopping criterion to avoid superfluous computation. Finally, we show that our approach obtains favorable restoration results compared to current approaches, across all tasks.
updated: Fri Jul 02 2021 15:10:42 GMT+0000 (UTC)
published: Fri Jul 02 2021 15:10:42 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト