arXiv reaDer
可逆ニューラルネットワークでの二重潜在変数を使用した画像再スケーリングの強化
Enhancing Image Rescaling using Dual Latent Variables in Invertible Neural Network
正規化フローモデルは、自然画像の複雑な分布を、可逆ニューラルネットワーク(INN)を介して潜在空間内の単純な扱いやすい分布に近似することにより、生成画像の超解像(SR)に使用されています。これらのモデルは、潜在空間でランダムにサンプリングされたポイントを使用して、1つの低解像度(LR)入力から複数のリアルなSR画像を生成し、複数の高解像度(HR)画像が同じLRに対応する画像アップスケーリングの不適切な性質をシミュレートできます。最近、INNの可逆プロセスは、ダウンスケーリングと逆アップスケーリングの共同最適化のためにIRNやHCFlowなどの双方向画像再スケーリングモデルでもうまく使用されており、アップスケールされた画質が大幅に向上しています。これらは画像のダウンスケーリングにも最適化されていますが、異なる補間カーネルとリサンプリング方法に応じて1つのHR画像を複数のLR画像に縮小できるという、画像ダウンスケーリングの不適切な性質は考慮されていません。画像のアップスケーリングの不確実性を表す元の変数に加えて、新しいダウンスケーリングの潜在変数が、画像のダウンスケーリングプロセスの変動をモデル化するために導入されました。この二重潜在変数の強化は、さまざまな画像再スケーリングモデルに適用可能であり、広範な実験で、ダウンスケールされたLR画像の画質を犠牲にすることなく画像のアップスケーリング精度を一貫して改善できることが示されています。また、画像の非表示などの画像復元アプリケーション向けに、他のINNベースのモデルを強化するのにも効果的であることが示されています。
Normalizing flow models have been used successfully for generative image super-resolution (SR) by approximating complex distribution of natural images to simple tractable distribution in latent space through Invertible Neural Networks (INN). These models can generate multiple realistic SR images from one low-resolution (LR) input using randomly sampled points in the latent space, simulating the ill-posed nature of image upscaling where multiple high-resolution (HR) images correspond to the same LR. Lately, the invertible process in INN has also been used successfully by bidirectional image rescaling models like IRN and HCFlow for joint optimization of downscaling and inverse upscaling, resulting in significant improvements in upscaled image quality. While they are optimized for image downscaling too, the ill-posed nature of image downscaling, where one HR image could be downsized to multiple LR images depending on different interpolation kernels and resampling methods, is not considered. A new downscaling latent variable, in addition to the original one representing uncertainties in image upscaling, is introduced to model variations in the image downscaling process. This dual latent variable enhancement is applicable to different image rescaling models and it is shown in extensive experiments that it can improve image upscaling accuracy consistently without sacrificing image quality in downscaled LR images. It is also shown to be effective in enhancing other INN-based models for image restoration applications like image hiding.
updated: Sun Jul 24 2022 23:12:51 GMT+0000 (UTC)
published: Sun Jul 24 2022 23:12:51 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト