arXiv reaDer
単一画像の超解像のための実用的な対照学習フレームワーク
A Practical Contrastive Learning Framework for Single Image Super-Resolution
対照学習は、さまざまな高レベルのタスクで目覚ましい成功を収めていますが、低レベルのタスクに対して提案されている方法はほとんどありません。取得したグローバルな視覚的表現は、豊富なテクスチャとコンテキスト情報を必要とする低レベルのタスクには不十分であるため、高レベルの視覚タスクに提案されたバニラ対照学習技術を低レベルの視覚タスクに直接採用することは困難です。この論文では、単一画像超解像(SISR)のための新しい対照学習フレームワークを提案します。対照的な学習ベースのSISRを、サンプルの構築と機能の埋め込みという2つの観点から調査します。既存の方法は、いくつかのナイーブなサンプル構築アプローチを提案し(たとえば、低品質の入力を負のサンプルと見なし、グラウンドトゥルースを正のサンプルと見なす)、事前モデル(たとえば、事前トレーニングされたVGGモデル)を採用して特徴を取得します。タスクに適したものを探索する代わりに、埋め込み。この目的のために、周波数空間で多くの有益な正およびハードネガティブサンプルの生成を含むSISRの実用的な対照学習フレームワークを提案します。追加の事前トレーニング済みネットワークを利用する代わりに、ディスクリミネーターネットワークから継承されたシンプルで効果的な埋め込みネットワークを設計し、プライマリSRネットワークで繰り返し最適化してタスクを一般化できるようにします。最後に、ベンチマークメソッドと比較してメソッドの広範な実験的評価を実施し、SISRの現在の最先端のアプローチに対して最大0.21dBの顕著なゲインを示しています。
Contrastive learning has achieved remarkable success on various high-level tasks, but there are fewer methods proposed for low-level tasks. It is challenging to adopt vanilla contrastive learning technologies proposed for high-level visual tasks straight to low-level visual tasks since the acquired global visual representations are insufficient for low-level tasks requiring rich texture and context information. In this paper, we propose a novel contrastive learning framework for single image super-resolution (SISR). We investigate the contrastive learning-based SISR from two perspectives: sample construction and feature embedding. The existing methods propose some naive sample construction approaches (e.g., considering the low-quality input as a negative sample and the ground truth as a positive sample) and they adopt a prior model (e.g., pre-trained VGG model) to obtain the feature embedding instead of exploring a task-friendly one. To this end, we propose a practical contrastive learning framework for SISR that involves the generation of many informative positive and hard negative samples in frequency space. Instead of utilizing an additional pre-trained network, we design a simple but effective embedding network inherited from the discriminator network and can be iteratively optimized with the primary SR network making it task-generalizable. Finally, we conduct an extensive experimental evaluation of our method compared with benchmark methods and show remarkable gains of up to 0.21 dB over the current state-of-the-art approaches for SISR.
updated: Sat Nov 27 2021 15:42:12 GMT+0000 (UTC)
published: Sat Nov 27 2021 15:42:12 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト