arXiv reaDer
効率的な画像超解像のための反復軟収縮学習
Iterative Soft Shrinkage Learning for Efficient Image Super-Resolution
画像超解像度 (SR) は、CNN からトランスフォーマー アーキテクチャに至るまで、広範なニューラル ネットワーク設計を目撃してきました。ただし、一般的な SR モデルは法外なメモリ使用量と集中的な計算に悩まされており、エッジ デバイスでのさらなる展開が制限されています。この研究では、既製のネットワーク設計を活用し、基礎的な計算オーバーヘッドを削減するための超解像度のためのネットワーク プルーニングの可能性を調査します。 SR に枝刈り手法を適用するには、2 つの主な課題が残っています。まず、広く使用されているフィルタ プルーニング技術は、粒度が限られていて、多様なネットワーク構造への適応性が限られていることを反映しています。第 2 に、既存の枝刈り手法は一般に、疎な構造を決定するために事前にトレーニングされたネットワーク上で動作するため、従来の SR パラダイムでは密なモデルのトレーニングを取り除くのが困難です。これらの課題に対処するために、私たちはスパース モデルを最初から直接トレーニングした非構造化枝刈りを採用しています。具体的には、反復ごとにランダムに初期化されたネットワークのスパース構造を最適化し、重要でない重みをマグニチュードスケールに比例する少量でオンザフライで微調整することにより、新しい反復ソフト収縮率(ISS-P)法を提案します。提案された ISS-P は、最適化プロセスに適応してスパース構造を動的に学習し、より正規化された勾配スループットを生み出すことでスパース モデルのトレーニング可能性を維持できることが観察されています。ベンチマーク データセットの実験により、さまざまなネットワーク アーキテクチャに対する提案された ISS-P の有効性が実証されています。コードは https://github.com/Jiamian-Wang/Iterative-Soft-Shrinkage-SR で入手できます。
Image super-resolution (SR) has witnessed extensive neural network designs from CNN to transformer architectures. However, prevailing SR models suffer from prohibitive memory footprint and intensive computations, which limits further deployment on edge devices. This work investigates the potential of network pruning for super-resolution to take advantage of off-the-shelf network designs and reduce the underlying computational overhead. Two main challenges remain in applying pruning methods for SR. First, the widely-used filter pruning technique reflects limited granularity and restricted adaptability to diverse network structures. Second, existing pruning methods generally operate upon a pre-trained network for the sparse structure determination, hard to get rid of dense model training in the traditional SR paradigm. To address these challenges, we adopt unstructured pruning with sparse models directly trained from scratch. Specifically, we propose a novel Iterative Soft Shrinkage-Percentage (ISS-P) method by optimizing the sparse structure of a randomly initialized network at each iteration and tweaking unimportant weights with a small amount proportional to the magnitude scale on-the-fly. We observe that the proposed ISS-P can dynamically learn sparse structures adapting to the optimization process and preserve the sparse model's trainability by yielding a more regularized gradient throughput. Experiments on benchmark datasets demonstrate the effectiveness of the proposed ISS-P over diverse network architectures. Code is available at https://github.com/Jiamian-Wang/Iterative-Soft-Shrinkage-SR
updated: Fri Aug 18 2023 01:52:34 GMT+0000 (UTC)
published: Thu Mar 16 2023 21:06:13 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト