arXiv reaDer
LCS:推論時の適応ネットワーク圧縮のための圧縮性部分空間の学習
LCS: Learning Compressible Subspaces for Adaptive Network Compression at Inference Time
ディープラーニングモデルをデバイスにデプロイする場合、従来、利用可能な計算リソース(計算、メモリ、および電力)は静的なままであると想定されていました。ただし、実際のコンピューティングシステムは、常に安定したリソース保証を提供するとは限りません。他のプロセスからの負荷が高い場合やバッテリーの電力が低い場合は、計算リソースを節約する必要があります。ニューラルネットワーク部分空間に関する最近の研究に触発されて、高効率から高精度までの範囲のモデルのきめ細かいスペクトルを含むニューラルネットワークの「圧縮性部分空間」をトレーニングする方法を提案します。モデルは再トレーニングを必要としないため、モデルの部分空間を完全にデバイス上に展開して、推論時に適応型ネットワーク圧縮を行うことができます。構造化スパース性と非構造化スパース性について、推論時に任意にきめ細かい精度と効率のトレードオフを達成するための結果を示します。非圧縮モデルをテストする場合、標準モデルと同等の精度を達成し、圧縮モデルをテストする場合、90%を超えるスパース率に対して高い精度を維持します。また、アルゴリズムが可変ビット幅での量子化に拡張され、個別にトレーニングされたネットワークと同等の精度を達成することも示しています。
When deploying deep learning models to a device, it is traditionally assumed that available computational resources (compute, memory, and power) remain static. However, real-world computing systems do not always provide stable resource guarantees. Computational resources need to be conserved when load from other processes is high or battery power is low. Inspired by recent works on neural network subspaces, we propose a method for training a "compressible subspace" of neural networks that contains a fine-grained spectrum of models that range from highly efficient to highly accurate. Our models require no retraining, thus our subspace of models can be deployed entirely on-device to allow adaptive network compression at inference time. We present results for achieving arbitrarily fine-grained accuracy-efficiency trade-offs at inference time for structured and unstructured sparsity. We achieve accuracies on-par with standard models when testing our uncompressed models, and maintain high accuracy for sparsity rates above 90% when testing our compressed models. We also demonstrate that our algorithm extends to quantization at variable bit widths, achieving accuracy on par with individually trained networks.
updated: Fri Oct 08 2021 17:03:34 GMT+0000 (UTC)
published: Fri Oct 08 2021 17:03:34 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト