arXiv reaDer
宝くじは重量の相関関係を維持します:それは望ましいかどうか?
Lottery Ticket Preserves Weight Correlation: Is It Desirable or Not?
深いモデル圧縮では、最近の発見「宝くじの仮説」(LTH)(Frankle&Carbin、2018)は、達成できる勝利チケット(つまり、適切に剪定されたサブネットワークと元の重みの初期化)が存在する可能性があることを指摘しました元の高密度ネットワークよりも競争力のあるパフォーマンス。ただし、多くのシナリオでこのような勝利の特性を観察することは容易ではありません。たとえば、元の密なモデルのトレーニングに役立つ場合でも、比較的大きな学習率が使用されます。この作業では、勝者のプロパティの背後にある根本的な条件と理論的根拠を調査し、根本的な理由は、学習率が十分に大きくない場合の初期化された重みと最終的にトレーニングされた重みの相関に大きく起因することを発見します。したがって、勝利プロパティの存在は、不十分なDNN事前トレーニングと相関しており、十分にトレーニングされたDNNでは発生しない可能性があります。この制限を克服するために、同じ剪定アルゴリズムと同じ合計トレーニングエポックの下で宝くじのスパーストレーニングを一貫して上回る「剪定と微調整」方法を提案します。提案を正当化するために、さまざまなデータセットで複数のディープモデル(VGG、ResNet、MobileNet-v2)を対象とした広範な実験が実施されました。
In deep model compression, the recent finding "Lottery Ticket Hypothesis" (LTH) (Frankle & Carbin, 2018) pointed out that there could exist a winning ticket (i.e., a properly pruned sub-network together with original weight initialization) that can achieve competitive performance than the original dense network. However, it is not easy to observe such winning property in many scenarios, where for example, a relatively large learning rate is used even if it benefits training the original dense model. In this work, we investigate the underlying condition and rationale behind the winning property, and find that the underlying reason is largely attributed to the correlation between initialized weights and final-trained weights when the learning rate is not sufficiently large. Thus, the existence of winning property is correlated with an insufficient DNN pretraining, and is unlikely to occur for a well-trained DNN. To overcome this limitation, we propose the "pruning & fine-tuning" method that consistently outperforms lottery ticket sparse training under the same pruning algorithm and the same total training epochs. Extensive experiments over multiple deep models (VGG, ResNet, MobileNet-v2) on different datasets have been conducted to justify our proposals.
updated: Sun Jul 18 2021 08:19:07 GMT+0000 (UTC)
published: Fri Feb 19 2021 14:49:46 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト