arXiv reaDer
スタイル転送モデルで宝くじをプレイする
Playing Lottery Tickets in Style Transfer Models
スタイル転送は、その柔軟なアプリケーションシナリオにより、大きな成功を収め、学術界と産業界の両方から幅広い注目を集めています。ただし、かなり大きなVGGベースのオートエンコーダに依存しているため、パラメータが複雑な既存のスタイルの転送モデルになり、リソースに制約のあるデバイスでのアプリケーションが制限されます。他の多くのタスクと比較して、スタイル転送モデルの圧縮はあまり検討されていません。最近、宝くじの仮説(LTH)は、単独でトレーニングした場合に元の完全なネットワークと同等またはそれ以上のパフォーマンスを達成できる、非常にまばらな一致するサブネットワークを見つける大きな可能性を示しています。この作業では、このようなトレーニング可能なマッチングサブネットワークがスタイル転送モデルにも存在するかどうかを検証するために、初めて実証研究を実行します。具体的には、2つの最も人気のあるスタイル転送モデル、つまりAdaINとSANetをメインのテストベッドとして採用します。これらは、それぞれグローバルおよびローカルの変換ベースのスタイル転送方法を表します。広範な実験と包括的な分析を実施し、以下の結論を導き出します。 (1)VGGエンコーダーを修正する場合と比較して、スタイル転送モデルは、ネットワーク全体を一緒にトレーニングすることでより多くのメリットを得ることができます。 (2)反復マグニチュードプルーニングを使用すると、一致するサブネットワークがAdaINで89.2%のスパース性、SANetで73.7%のスパース性であることがわかります。これは、スタイル転送モデルでも宝くじを再生できることを示しています。 (3)一致するサブネットワークの存在と品質に影響を与えることなく、はるかにまばらなモデルを取得するために、機能変換モジュールもプルーニングする必要があります。 (4)AdaINとSANetの他に、LST、MANet、AdaAttN、MCCNetなどの他のモデルも宝くじをプレイできます。これは、LTHをさまざまなスタイルの転送モデルに一般化できることを示しています。
Style transfer has achieved great success and attracted a wide range of attention from both academic and industrial communities due to its flexible application scenarios. However, the dependence on a pretty large VGG-based autoencoder leads to existing style transfer models having high parameter complexities, which limits their applications on resource-constrained devices. Compared with many other tasks, the compression of style transfer models has been less explored. Recently, the lottery ticket hypothesis (LTH) has shown great potential in finding extremely sparse matching subnetworks which can achieve on par or even better performance than the original full networks when trained in isolation. In this work, we for the first time perform an empirical study to verify whether such trainable matching subnetworks also exist in style transfer models. Specifically, we take two most popular style transfer models, i.e., AdaIN and SANet, as the main testbeds, which represent global and local transformation based style transfer methods respectively. We carry out extensive experiments and comprehensive analysis, and draw the following conclusions. (1) Compared with fixing the VGG encoder, style transfer models can benefit more from training the whole network together. (2) Using iterative magnitude pruning, we find the matching subnetworks at 89.2% sparsity in AdaIN and 73.7% sparsity in SANet, which demonstrates that style transfer models can play lottery tickets too. (3) The feature transformation module should also be pruned to obtain a much sparser model without affecting the existence and quality of the matching subnetworks. (4) Besides AdaIN and SANet, other models such as LST, MANet, AdaAttN and MCCNet can also play lottery tickets, which shows that LTH can be generalized to various style transfer models.
updated: Sun Apr 10 2022 09:07:37 GMT+0000 (UTC)
published: Fri Mar 25 2022 17:43:18 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト