arXiv reaDer
Swin Transformer の N-Gram による効率的な軽量画像の超解像
N-Gram in Swin Transformers for Efficient Lightweight Image Super-Resolution
いくつかの研究では、ウィンドウ自己注意 (WSA) を備えた Swin Transformer (Swin) が単一画像の超解像 (SR) に適していることが証明されていますが、単純な WSA は、限られた受容野のために高解像度画像を再構成するときに広い領域を無視します。 .さらに、多くの深層学習 SR メソッドは、集中的な計算に悩まされています。これらの問題に対処するために、N-Gram コンテキストを Transformers の低レベル ビジョンに初めて導入します。 Swin では、N-Gram を隣接するローカル ウィンドウとして定義します。これは、N-Gram を連続した文字または単語と見なすテキスト分析とは異なります。 N グラムは、スライド WSA によって相互に作用し、劣化したピクセルを復元する領域を拡大します。 N-Gram コンテキストを使用して、階層エンコーダーのマルチスケール出力を取得する SCDP ボトルネックを備えた効率的な SR ネットワークである NGswin を提案します。実験結果は、NGswin が以前の主要な方法と比較して、効率的な構造を維持しながら競争力のあるパフォーマンスを達成することを示しています。さらに、N-Gram コンテキストを使用して他の Swin ベースの SR メソッドも改善し、それによって強化されたモデル SwinIR-NG を構築します。改良された SwinIR-NG は、現在の最高の軽量 SR アプローチよりも優れており、最先端の結果を確立しています。コードは https://github.com/rami0205/NGramSwin で入手できます。
While some studies have proven that Swin Transformer (Swin) with window self-attention (WSA) is suitable for single image super-resolution (SR), the plain WSA ignores the broad regions when reconstructing high-resolution images due to a limited receptive field. In addition, many deep learning SR methods suffer from intensive computations. To address these problems, we introduce the N-Gram context to the low-level vision with Transformers for the first time. We define N-Gram as neighboring local windows in Swin, which differs from text analysis that views N-Gram as consecutive characters or words. N-Grams interact with each other by sliding-WSA, expanding the regions seen to restore degraded pixels. Using the N-Gram context, we propose NGswin, an efficient SR network with SCDP bottleneck taking multi-scale outputs of the hierarchical encoder. Experimental results show that NGswin achieves competitive performance while maintaining an efficient structure when compared with previous leading methods. Moreover, we also improve other Swin-based SR methods with the N-Gram context, thereby building an enhanced model: SwinIR-NG. Our improved SwinIR-NG outperforms the current best lightweight SR approaches and establishes state-of-the-art results. Codes are available at https://github.com/rami0205/NGramSwin.
updated: Mon Mar 20 2023 12:48:37 GMT+0000 (UTC)
published: Mon Nov 21 2022 13:23:52 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト