arXiv reaDer
スパースImagenetモデルはどの程度うまく転送されますか?
How Well Do Sparse Imagenet Models Transfer?
転移学習は、大規模な「上流」データセットで事前トレーニングされたモデルを適応させて、「下流」の特殊なデータセットで良好な結果をもたらす古典的なパラダイムです。一般に、「アップストリーム」データセットでより正確なモデルを使用すると、「ダウンストリーム」での転送精度が向上することが理解されています。この作業では、剪定された、つまり接続をスパース化することによって圧縮されたImageNetデータセットでトレーニングされた畳み込みニューラルネットワーク(CNN)のコンテキストで、この現象の詳細な調査を実行します。具体的には、12の標準的な転送タスクのコンテキストで、マグニチュードベース、2次、再成長、正則化アプローチなど、いくつかの最先端の剪定方法を適用して得られた非構造化剪定モデルを使用した転送を検討します。一言で言えば、私たちの研究は、スパースモデルは、高スパース性でも、高密度モデルの転送パフォーマンスに匹敵するか、それを上回ることができ、そうする一方で、重要な推論やトレーニングのスピードアップにつながる可能性があることを示しています。同時に、さまざまな剪定方法の動作の有意差を観察および分析します。
Transfer learning is a classic paradigm by which models pretrained on large "upstream" datasets are adapted to yield good results on "downstream," specialized datasets. Generally, it is understood that more accurate models on the "upstream" dataset will provide better transfer accuracy "downstream". In this work, we perform an in-depth investigation of this phenomenon in the context of convolutional neural networks (CNNs) trained on the ImageNet dataset, which have been pruned - that is, compressed by sparsifiying their connections. Specifically, we consider transfer using unstructured pruned models obtained by applying several state-of-the-art pruning methods, including magnitude-based, second-order, re-growth and regularization approaches, in the context of twelve standard transfer tasks. In a nutshell, our study shows that sparse models can match or even outperform the transfer performance of dense models, even at high sparsities, and, while doing so, can lead to significant inference and even training speedups. At the same time, we observe and analyze significant differences in the behaviour of different pruning methods.
updated: Fri Nov 26 2021 11:58:51 GMT+0000 (UTC)
published: Fri Nov 26 2021 11:58:51 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト