arXiv reaDer
単一画像超解像度のための実践的な対照学習フレームワーク
A Practical Contrastive Learning Framework for Single-Image Super-Resolution
対照学習はさまざまな高レベルのタスクで目覚ましい成功を収めていますが、低レベルのタスクに対して提案されている対照学習ベースの方法はほとんどありません。高レベルの視覚タスク用に提案されたバニラ対照学習技術を、低レベルの画像復元問題にそのまま採用するのは困難です。取得された高レベルのグローバル視覚表現は、豊富なテクスチャとコンテキスト情報を必要とする低レベルのタスクには不十分であるためです。この論文では、ポジティブサンプルとネガティブサンプルの構築と特徴の埋め込みという 2 つの観点から、対比学習ベースの単一画像超解像を調査します。既存の方法は、単純なサンプル構築アプローチ(たとえば、低品質の入力をネガティブサンプルとして、グラウンドトゥルースをポジティブサンプルとして考慮する)を採用し、事前のモデル(たとえば、事前トレーニングされたVGGモデル)を採用して特徴の埋め込みを取得します。この目的を達成するために、我々は、PCL-SR と呼ばれる SISR 用の実用的な対比学習フレームワークを提案します。周波数空間で多くの有益なポジティブサンプルとハードネガティブサンプルを生成します。追加の事前トレーニング済みネットワークを利用する代わりに、識別器ネットワークから継承した、よりタスクに適したシンプルだが効果的な埋め込みネットワークを設計します。既存のベンチマーク手法と比較して、私たちが提案する PCL-SR フレームワークによって再トレーニングし、優れたパフォーマンスを実現します。私たちが提案する PCL-SR による徹底的なアブレーション研究の有効性と技術的貢献を示すために、広範な実験が行われました。コードと事前トレーニングされたモデルは https://github.com/Aitical/PCL-SISR にあります。
Contrastive learning has achieved remarkable success on various high-level tasks, but there are fewer contrastive learning-based methods proposed for low-level tasks. It is challenging to adopt vanilla contrastive learning technologies proposed for high-level visual tasks to low-level image restoration problems straightly. Because the acquired high-level global visual representations are insufficient for low-level tasks requiring rich texture and context information. In this paper, we investigate the contrastive learning-based single image super-resolution from two perspectives: positive and negative sample construction and feature embedding. The existing methods take naive sample construction approaches (e.g., considering the low-quality input as a negative sample and the ground truth as a positive sample) and adopt a prior model (e.g., pre-trained VGG model) to obtain the feature embedding. To this end, we propose a practical contrastive learning framework for SISR, named PCL-SR. We involve the generation of many informative positive and hard negative samples in frequency space. Instead of utilizing an additional pre-trained network, we design a simple but effective embedding network inherited from the discriminator network which is more task-friendly. Compared with existing benchmark methods, we re-train them by our proposed PCL-SR framework and achieve superior performance. Extensive experiments have been conducted to show the effectiveness and technical contributions of our proposed PCL-SR thorough ablation studies. The code and pre-trained models can be found at https://github.com/Aitical/PCL-SISR.
updated: Sun Jul 16 2023 16:00:40 GMT+0000 (UTC)
published: Sat Nov 27 2021 15:42:12 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト