arXiv reaDer
圧縮を意識した画像再スケーリングのための自己非対称可逆ネットワーク
Self-Asymmetric Invertible Network for Compression-Aware Image Rescaling
通常、高解像度 (HR) の画像は、表示を改善するために低解像度 (LR) の画像に縮小され、その後、詳細を復元するために元のサイズに拡大されます。画像の再スケーリングに関する最近の研究では、ダウンスケーリングとアップスケーリングを統一されたタスクとして定式化し、可逆ネットワークを介して HR と LR の間の全単射マッピングを学習します。ただし、実際のアプリケーション (ソーシャル メディアなど) では、ほとんどの画像が送信用に圧縮されます。非可逆圧縮は、LR 画像の不可逆的な情報損失につながるため、逆アップスケーリング手順が損なわれ、再構成の精度が低下します。この論文では、圧縮を意識した画像再スケーリングのための自己非対称反転可能ネットワーク (SAIN) を提案します。分布のシフトに取り組むために、まず、高品質の LR 画像と圧縮された LR 画像の 2 つの個別の全単射マッピングを備えたエンドツーエンドの非対称フレームワークを開発しました。次に、このフレームワークの経験的分析に基づいて、等方性ガウス混合を使用して失われた情報の分布 (ダウンスケーリングと圧縮を含む) をモデル化し、1 回のフォワード パスで高品質/圧縮された LR 画像を導出する拡張反転ブロックを提案します。さらに、学習した LR 画像を正則化し、可逆性を高める一連の損失を設計します。広範な実験により、標準的な画像圧縮形式 (JPEG や WebP) での定量的評価と定性的評価の両方に関して、さまざまな画像再スケーリング データセット全体で SAIN の一貫した改善が実証されています。
High-resolution (HR) images are usually downscaled to low-resolution (LR) ones for better display and afterward upscaled back to the original size to recover details. Recent work in image rescaling formulates downscaling and upscaling as a unified task and learns a bijective mapping between HR and LR via invertible networks. However, in real-world applications (e.g., social media), most images are compressed for transmission. Lossy compression will lead to irreversible information loss on LR images, hence damaging the inverse upscaling procedure and degrading the reconstruction accuracy. In this paper, we propose the Self-Asymmetric Invertible Network (SAIN) for compression-aware image rescaling. To tackle the distribution shift, we first develop an end-to-end asymmetric framework with two separate bijective mappings for high-quality and compressed LR images, respectively. Then, based on empirical analysis of this framework, we model the distribution of the lost information (including downscaling and compression) using isotropic Gaussian mixtures and propose the Enhanced Invertible Block to derive high-quality/compressed LR images in one forward pass. Besides, we design a set of losses to regularize the learned LR images and enhance the invertibility. Extensive experiments demonstrate the consistent improvements of SAIN across various image rescaling datasets in terms of both quantitative and qualitative evaluation under standard image compression formats (i.e., JPEG and WebP).
updated: Sat Mar 11 2023 19:53:30 GMT+0000 (UTC)
published: Sat Mar 04 2023 08:33:46 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト