参照ベースの超解像 (Ref-SR) は、最近、追加の高解像度 (HR) 参照画像を導入することにより、低解像度 (LR) 入力画像を強化する有望なパラダイムとして浮上しています。既存の Ref-SR メソッドは、ほとんどの場合、入力画像の情報損失を補うために、参照画像から HR テクスチャを借用する暗黙の対応マッチングに依存しています。ただし、入力画像と参照画像の間に 2 つのギャップがあるため、ローカル転送を実行することは困難です: 変換ギャップ (スケールと回転など) と解像度ギャップ (HR と LR など)これらの課題に取り組むために、この作業で C2-Matching を提案します。これは、明示的なロバストなマッチング クロッシング変換と解決を生成します。 1) 変換ギャップのために、入力画像の拡張ビューを使用して変換ロバスト対応を学習する対照対応ネットワークを提案します。 2) 解像度のギャップについては、教師と生徒の相関蒸留を採用しています。これは、より曖昧な LR-HR マッチングを導くために、より簡単な HR-HR マッチングから知識を抽出します。 3) 最後に、潜在的な不整合の問題に対処する動的な集計モジュールを設計します。さらに、現実的な設定で Ref-SR のパフォーマンスを忠実に評価するために、実際の使用シナリオを模倣した Webly-Referenced SR (WR-SR) データセットを提供します。大規模な実験により、提案された C2-Matching は、標準の CUFED5 ベンチマークで最先端の技術よりも 1dB 以上大幅に優れていることが示されています。特に、WR-SR データセットの優れた一般化可能性と、大規模な回転変換全体の堅牢性も示しています。
Reference-based Super-Resolution (Ref-SR) has recently emerged as a promising paradigm to enhance a low-resolution (LR) input image by introducing an additional high-resolution (HR) reference image. Existing Ref-SR methods mostly rely on implicit correspondence matching to borrow HR textures from reference images to compensate for the information loss in input images. However, performing local transfer is difficult because of two gaps between input and reference images: the transformation gap (e.g. scale and rotation) and the resolution gap (e.g. HR and LR). To tackle these challenges, we propose C2-Matching in this work, which produces explicit robust matching crossing transformation and resolution. 1) For the transformation gap, we propose a contrastive correspondence network, which learns transformation-robust correspondences using augmented views of the input image. 2) For the resolution gap, we adopt a teacher-student correlation distillation, which distills knowledge from the easier HR-HR matching to guide the more ambiguous LR-HR matching. 3) Finally, we design a dynamic aggregation module to address the potential misalignment issue. In addition, to faithfully evaluate the performance of Ref-SR under a realistic setting, we contribute the Webly-Referenced SR (WR-SR) dataset, mimicking the practical usage scenario. Extensive experiments demonstrate that our proposed C2-Matching significantly outperforms state of the arts by over 1dB on the standard CUFED5 benchmark. Notably, it also shows great generalizability on WR-SR dataset as well as robustness across large scale and rotation transformations.