arXiv reaDer
変更されたビーム検索と変更された安定ランクを使用したディープニューラルネットワークの非常に効果的な低ランク圧縮
A Highly Effective Low-Rank Compression of Deep Neural Networks with Modified Beam-Search and Modified Stable Rank
圧縮は、特に計算能力とストレージ容量が限られているエッジデバイスにとって、重要なディープラーニング研究トピックの1つとして浮上しています。主な圧縮手法の中で、行列因数分解による低ランクの圧縮には2つの問題があることが知られています。まず、大規模な調整が必要です。第二に、結果として得られる圧縮性能は、通常、印象的ではありません。この作業では、自動ランク選択のための修正ビーム検索と圧縮に適したトレーニングのための修正安定ランクを利用する低ランク圧縮方法を提案します。結果として得られるBSR(ビーム検索および安定ランク)アルゴリズムでは、1つのハイパーパラメーターのみを必要な圧縮率に調整する必要があります。精度と圧縮率のトレードオフ曲線に関するBSRのパフォーマンスは、以前から知られている低ランクの圧縮方法よりも優れていることがわかります。さらに、BSRは、最先端の構造化された剪定方法と同等またはそれ以上のパフォーマンスを発揮します。剪定と同様に、BSRは追加の圧縮のために量子化と簡単に組み合わせることができます。
Compression has emerged as one of the essential deep learning research topics, especially for the edge devices that have limited computation power and storage capacity. Among the main compression techniques, low-rank compression via matrix factorization has been known to have two problems. First, an extensive tuning is required. Second, the resulting compression performance is typically not impressive. In this work, we propose a low-rank compression method that utilizes a modified beam-search for an automatic rank selection and a modified stable rank for a compression-friendly training. The resulting BSR (Beam-search and Stable Rank) algorithm requires only a single hyperparameter to be tuned for the desired compression ratio. The performance of BSR in terms of accuracy and compression ratio trade-off curve turns out to be superior to the previously known low-rank compression methods. Furthermore, BSR can perform on par with or better than the state-of-the-art structured pruning methods. As with pruning, BSR can be easily combined with quantization for an additional compression.
updated: Wed Dec 01 2021 01:52:01 GMT+0000 (UTC)
published: Tue Nov 30 2021 07:36:23 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト