arXiv reaDer
画像の再構成と合成のための焦点周波数損失
Focal Frequency Loss for Image Reconstruction and Synthesis
画像の再構築と合成は、生成モデルの開発のおかげで目覚ましい進歩を遂げました。それにもかかわらず、特に周波数領域では、実際の画像と生成された画像の間にギャップが存在する可能性があります。この研究では、周波数領域のギャップを狭めることで、画像の再構成と合成の品質をさらに改善できることを示しています。簡単な周波数成分をダウンウェイトすることで、合成が難しい周波数成分にモデルが適応的に焦点を合わせることができる、新しい焦点周波数損失を提案します。この目的関数は、既存の空間損失を補完し、ニューラルネットワークの固有のバイアスによる重要な周波数情報の損失に対して大きなインピーダンスを提供します。知覚品質と定量的パフォーマンスの両方で、VAE、pix2pix、SPADEなどの一般的なモデルを改善するための焦点周波数損失の多様性と有効性を示します。さらに、StyleGAN2でその可能性を示します。
Image reconstruction and synthesis have witnessed remarkable progress thanks to the development of generative models. Nonetheless, gaps could still exist between the real and generated images, especially in the frequency domain. In this study, we show that narrowing gaps in the frequency domain can ameliorate image reconstruction and synthesis quality further. We propose a novel focal frequency loss, which allows a model to adaptively focus on frequency components that are hard to synthesize by down-weighting the easy ones. This objective function is complementary to existing spatial losses, offering great impedance against the loss of important frequency information due to the inherent bias of neural networks. We demonstrate the versatility and effectiveness of focal frequency loss to improve popular models, such as VAE, pix2pix, and SPADE, in both perceptual quality and quantitative performance. We further show its potential on StyleGAN2.
updated: Sun Apr 04 2021 09:20:30 GMT+0000 (UTC)
published: Wed Dec 23 2020 17:32:04 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト