arXiv reaDer
単一画像超解像用トランス
Transformer for Single Image Super-Resolution
単一画像の超解像(SISR)は、ディープラーニングの開発で大きな進歩を遂げました。ただし、ほとんどの既存の研究は、膨大な数の層を持つより複雑なネットワークの構築に焦点を合わせています。最近、ますます多くの研究者がコンピュータビジョンタスクにおけるTransformerのアプリケーションを探求し始めています。ただし、ビジョントランスフォーマーの重い計算コストと高いGPUメモリ占有は無視できません。この論文では、SISR用の新しい効率的な超解像変圧器(ESRT)を提案します。 ESRTは、軽量CNNバックボーン(LCB)と軽量変圧器バックボーン(LTB)で構成されるハイブリッドモデルです。その中で、LCBは特徴マップのサイズを動的に調整して、低い計算コストで深い特徴を抽出できます。 LTBは、特別に設計されたEfficient Multi-Head Attention(EMHA)のおかげで、小さなGPUメモリ占有を占める一連のEfficient Transformers(ET)で構成されています。広範な実験により、ESRTは低い計算コストで競争力のある結果を達成することが示されています。 16,057MのGPUメモリを占有する元のTransformerと比較すると、ESRTは4,191MGPUメモリしか占有しません。すべてのコードはhttps://github.com/luissen/ESRTで入手できます。
Single image super-resolution (SISR) has witnessed great strides with the development of deep learning. However, most existing studies focus on building more complex networks with a massive number of layers. Recently, more and more researchers start to explore the application of Transformer in computer vision tasks. However, the heavy computational cost and high GPU memory occupation of the vision Transformer cannot be ignored. In this paper, we propose a novel Efficient Super-Resolution Transformer (ESRT) for SISR. ESRT is a hybrid model, which consists of a Lightweight CNN Backbone (LCB) and a Lightweight Transformer Backbone (LTB). Among them, LCB can dynamically adjust the size of the feature map to extract deep features with a low computational cost. LTB is composed of a series of Efficient Transformers (ET), which occupies a small GPU memory occupation, thanks to the specially designed Efficient Multi-Head Attention (EMHA). Extensive experiments show that ESRT achieves competitive results with low computational costs. Compared with the original Transformer which occupies 16,057M GPU memory, ESRT only occupies 4,191M GPU memory. All codes are available at https://github.com/luissen/ESRT.
updated: Fri Apr 22 2022 05:56:50 GMT+0000 (UTC)
published: Wed Aug 25 2021 07:05:30 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト