ディープ モデル、特に大きなカーネル (3×3 以上) を備えた大規模モデルでは、単一画像超解像度 (SISR) タスクで重要なプロセスが実現されました。ただし、このようなモデルの計算フットプリントは大きいため、リアルタイムのリソースに制約のある環境では展開できません。逆に、1×1 畳み込みは大幅な計算効率をもたらしますが、SISR モデルに不可欠な機能であるローカル空間表現の集約に苦労します。この二分法に応えて、私たちは 3×3 カーネルと 1×1 カーネルの両方の利点を調和させ、軽量 SISR タスクの大きな可能性を活用することを提案します。具体的には、Shift-Conv-based Network (SCNet) と呼ばれる、シンプルで効果的な完全 1×1 畳み込みネットワークを提案します。パラメータフリーの空間シフト演算を組み込むことにより、完全な 1×1 畳み込みネットワークに強力な表現機能を備え、同時に優れた計算効率を実現します。広範な実験により、SCNet は完全に 1×1 畳み込み構造であるにもかかわらず、通常の畳み込みを使用する既存の軽量 SR モデルのパフォーマンスに一貫して匹敵する、またはそれを上回ることが実証されました。
Deep models have achieved significant process on single image super-resolution (SISR) tasks, in particular large models with large kernel (3×3 or more). However, the heavy computational footprint of such models prevents their deployment in real-time, resource-constrained environments. Conversely, 1×1 convolutions bring substantial computational efficiency, but struggle with aggregating local spatial representations, an essential capability to SISR models. In response to this dichotomy, we propose to harmonize the merits of both 3×3 and 1×1 kernels, and exploit a great potential for lightweight SISR tasks. Specifically, we propose a simple yet effective fully 1×1 convolutional network, named Shift-Conv-based Network (SCNet). By incorporating a parameter-free spatial-shift operation, it equips the fully 1×1 convolutional network with powerful representation capability while impressive computational efficiency. Extensive experiments demonstrate that SCNets, despite its fully 1×1 convolutional structure, consistently matches or even surpasses the performance of existing lightweight SR models that employ regular convolutions.