arXiv reaDer
フローガイダンスによる画像再スケーリングの限界に近づく
Approaching the Limit of Image Rescaling via Flow Guidance
画像のダウンスケーリングとアップスケーリングは、2つの基本的な再スケーリング操作です。画像が縮小されると、情報が失われるため、拡大によって再構築することは困難です。これらの2つのプロセスの互換性を高め、再構成のパフォーマンスを向上させるために、ダウンスケールされた(つまりエンコードされた)低解像度(LR)画像が元の視覚的外観を維持する必要があるという制約の下で、それらを共同のエンコード/デコードタスクとしてモデル化する取り組みがあります。この制約を実装するために、ほとんどのメソッドは、元の高解像度(HR)画像の双立方的にダウンスケールされたLRバージョンでモジュールを監視することにより、ダウンスケーリングモジュールをガイドします。ただし、このバイキュービックLRガイダンスは、その後のアップスケーリング(つまり、デコード)には最適ではなく、最終的な再構成のパフォーマンスを制限する可能性があります。この論文では、LRガイダンスを直接適用する代わりに、ダウンスケーリング中にダウンスケールされた表現を視覚的にもっともらしい画像に変換し、アップスケーリング中に元に戻すことができる追加の可逆フローガイダンスモジュール(FGM)を提案します。 FGMの可逆性の恩恵を受けて、ダウンスケールされた表現はLRガイダンスを取り除くことができ、ダウンスケーリング-アップスケーリングプロセスを妨げることはありません。これにより、ダウンスケーリングモジュールの制限を取り除き、エンドツーエンドの方法でダウンスケーリングおよびアップスケーリングモジュールを最適化できます。このようにして、これら2つのモジュールが連携して、HR再構築のパフォーマンスを最大化できます。広範な実験は、提案された方法が、ダウンスケールされた画像と再構成された画像の両方で最先端の(SotA)パフォーマンスを達成できることを示しています。
Image downscaling and upscaling are two basic rescaling operations. Once the image is downscaled, it is difficult to be reconstructed via upscaling due to the loss of information. To make these two processes more compatible and improve the reconstruction performance, some efforts model them as a joint encoding-decoding task, with the constraint that the downscaled (i.e. encoded) low-resolution (LR) image must preserve the original visual appearance. To implement this constraint, most methods guide the downscaling module by supervising it with the bicubically downscaled LR version of the original high-resolution (HR) image. However, this bicubic LR guidance may be suboptimal for the subsequent upscaling (i.e. decoding) and restrict the final reconstruction performance. In this paper, instead of directly applying the LR guidance, we propose an additional invertible flow guidance module (FGM), which can transform the downscaled representation to the visually plausible image during downscaling and transform it back during upscaling. Benefiting from the invertibility of FGM, the downscaled representation could get rid of the LR guidance and would not disturb the downscaling-upscaling process. It allows us to remove the restrictions on the downscaling module and optimize the downscaling and upscaling modules in an end-to-end manner. In this way, these two modules could cooperate to maximize the HR reconstruction performance. Extensive experiments demonstrate that the proposed method can achieve state-of-the-art (SotA) performance on both downscaled and reconstructed images.
updated: Tue Nov 09 2021 13:17:38 GMT+0000 (UTC)
published: Tue Nov 09 2021 13:17:38 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト