Iterative Low-Rank Approximation for CNN Compression
 ディープコンボリューショナルニューラルネットワークには数千万のパラメーターが含まれているため、組み込みデバイスで効率的に作業することはできません。ディープ畳み込みニューラルネットワークを圧縮するために低ランク近似を適用する反復アプローチを提案します。分類とオブジェクト検出は組み込みデバイスにとって最も好まれるタスクであるため、AlexNet、VGG-16、YOLOv2、Tiny YOLOネットワークを圧縮することにより、アプローチの有効性を実証します。我々の結果は、非反復法と比較した提案法の優位性を示しています。圧縮率が高く、精度の低下が少ないことを実証しています。
Deep convolutional neural networks contain tens of millions of parameters, making them impossible to work efficiently on embedded devices. We propose iterative approach of applying low-rank approximation to compress deep convolutional neural networks. Since classification and object detection are the most favored tasks for embedded devices, we demonstrate the effectiveness of our approach by compressing AlexNet, VGG-16, YOLOv2 and Tiny YOLO networks. Our results show the superiority of the proposed method compared to non-repetitive ones. We demonstrate higher compression ratio providing less accuracy loss.
updated: Fri Nov 15 2019 12:27:42 GMT+0000 (UTC)
published: Fri Mar 23 2018 22:04:48 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト