arXiv reaDer
スパースImagenetモデルはどの程度うまく転送されますか?
How Well Do Sparse Imagenet Models Transfer?
転移学習は、大規模な「上流」データセットで事前トレーニングされたモデルを適応させて、「下流」特殊データセットで良好な結果をもたらす古典的なパラダイムです。一般に、「アップストリーム」データセットのより正確なモデルは、「ダウンストリーム」の転送精度を向上させる傾向があります。この作業では、剪定された、つまり接続をスパース化することによって圧縮されたImageNetデータセットでトレーニングされた畳み込みニューラルネットワーク(CNN)のコンテキストで、この現象の詳細な調査を実行します。 12の標準的な転送タスクのコンテキストで、マグニチュードベース、2次、再成長、宝くじ、正則化のアプローチなど、いくつかの最先端の剪定方法を適用して得られた非構造化剪定モデルを使用した転送を検討します。 。一言で言えば、私たちの研究は、スパースモデルは、スパース性が高い場合でも、密なモデルの転送パフォーマンスに匹敵するか、それを上回ることができ、そうすることで、大幅な推論とトレーニングのスピードアップにつながる可能性があることを示しています。同時に、さまざまな剪定方法の動作の有意差を観察および分析します。
Transfer learning is a classic paradigm by which models pretrained on large "upstream" datasets are adapted to yield good results on "downstream" specialized datasets. Generally, more accurate models on the "upstream" dataset tend to provide better transfer accuracy "downstream". In this work, we perform an in-depth investigation of this phenomenon in the context of convolutional neural networks (CNNs) trained on the ImageNet dataset, which have been pruned - that is, compressed by sparsifying their connections. We consider transfer using unstructured pruned models obtained by applying several state-of-the-art pruning methods, including magnitude-based, second-order, re-growth, lottery-ticket, and regularization approaches, in the context of twelve standard transfer tasks. In a nutshell, our study shows that sparse models can match or even outperform the transfer performance of dense models, even at high sparsities, and, while doing so, can lead to significant inference and even training speedups. At the same time, we observe and analyze significant differences in the behaviour of different pruning methods.
updated: Thu Apr 21 2022 12:19:20 GMT+0000 (UTC)
published: Fri Nov 26 2021 11:58:51 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト