arXiv reaDer
FCL-GAN:教師なしブラインド画像のぼけ除去のための軽量でリアルタイムのベースライン
FCL-GAN: A Lightweight and Real-Time Baseline for Unsupervised Blind Image Deblurring
ブラインド画像のぼけ除去(BID)は、依然として困難で重要な作業です。ディープラーニングの強力なフィッティング能力の恩恵を受けて、ペアのデータ駆動型の監視付きBIDメソッドは大きな進歩を遂げました。ただし、ペアのデータは通常手作業で合成され、現実的なぼかしは合成データよりも複雑であるため、監視ありの方法では現実的なぼかしのモデリングが不十分になり、実際のアプリケーションが妨げられます。このように、ペアデータのない教師なしディープBID法には特定の利点がありますが、現在の方法には、モデルサイズが大きい、推論時間が長い、画像の解像度とドメインの要件が厳しいなど、いくつかの欠点があります。この論文では、周波数領域の対照的損失制約付き軽量CycleGAN(略してFCL-GAN)と呼ばれる、軽量でリアルタイムの教師なしBIDベースラインを提案します。これは、魅力的な特性、つまり、画像領域の制限なし、画像の解像度の制限なし、25倍です。 SOTAよりも軽く、SOTAよりも5倍高速です。軽量性と性能の優位性を保証するために、軽量ドメイン変換ユニット(LDCU)とパラメーターフリー周波数領域コントラストユニット(PFCU)と呼ばれる2つの新しいコラボレーションユニットが設計されています。 LDCUは、主にドメイン間変換を軽量に実装します。 PFCUは、追加のパラメータを使用せずに、周波数領域のぼやけた領域と鮮明な領域の画像間の類似性の尺度、外部の違い、および内部の接続をさらに調査します。いくつかの画像データセットでの広範な実験は、パフォーマンス、モデルサイズ、および参照時間の観点から、FCL-GANの有効性を示しています。
Blind image deblurring (BID) remains a challenging and significant task. Benefiting from the strong fitting ability of deep learning, paired data-driven supervised BID method has obtained great progress. However, paired data are usually synthesized by hand, and the realistic blurs are more complex than synthetic ones, which makes the supervised methods inept at modeling realistic blurs and hinders their real-world applications. As such, unsupervised deep BID method without paired data offers certain advantages, but current methods still suffer from some drawbacks, e.g., bulky model size, long inference time, and strict image resolution and domain requirements. In this paper, we propose a lightweight and real-time unsupervised BID baseline, termed Frequency-domain Contrastive Loss Constrained Lightweight CycleGAN (shortly, FCL-GAN), with attractive properties, i.e., no image domain limitation, no image resolution limitation, 25x lighter than SOTA, and 5x faster than SOTA. To guarantee the lightweight property and performance superiority, two new collaboration units called lightweight domain conversion unit(LDCU) and parameter-free frequency-domain contrastive unit(PFCU) are designed. LDCU mainly implements inter-domain conversion in lightweight manner. PFCU further explores the similarity measure, external difference and internal connection between the blurred domain and sharp domain images in frequency domain, without involving extra parameters. Extensive experiments on several image datasets demonstrate the effectiveness of our FCL-GAN in terms of performance, model size and reference time.
updated: Sun Jul 24 2022 03:24:43 GMT+0000 (UTC)
published: Sat Apr 16 2022 15:08:03 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト