arXiv reaDer
自動グラフエンコーダー-ニューラルネットワークプルーニング用デコーダー
Auto Graph Encoder-Decoder for Neural Network Pruning
モデル圧縮は、コンピューティングリソースとストレージリソースが限られているモバイルデバイスにディープニューラルネットワーク(DNN)を展開することを目的としています。ただし、既存のモデル圧縮方法のほとんどは、ドメインの専門知識を必要とする手動で定義されたルールに依存しています。 DNNは本質的に計算グラフであり、豊富な構造情報が含まれています。この論文では、DNNの構造情報から適切な圧縮ポリシーを見つけることを目指しています。グラフニューラルネットワーク(GNN)と強化学習(RL)を組み合わせた自動グラフエンコーダ-デコーダモデル圧縮(AGMC)法を提案します。ターゲットDNNをグラフとしてモデル化し、GNNを使用してDNNの埋め込みを自動的に学習します。私たちの方法をルールベースのDNN埋め込みモデル圧縮方法と比較して、私たちの方法の有効性を示しました。結果は、学習ベースのDNN埋め込みが、より少ない検索ステップでより優れたパフォーマンスとより高い圧縮率を実現することを示しています。過剰にパラメータ化されたモバイルフレンドリーなDNNでメソッドを評価し、手作りの学習ベースのモデル圧縮アプローチとメソッドを比較しました。 ResNet-56などのパラメータ化されたDNNでは、私たちの方法は、手作りの方法と学習ベースの方法をそれぞれ4.36%と2.56%高い精度で上回りました。さらに、MobileNet-v2では、わずか0.93%の精度低下で、最先端の方法よりも高い圧縮率を達成しました。
Model compression aims to deploy deep neural networks (DNN) on mobile devices with limited computing and storage resources. However, most of the existing model compression methods rely on manually defined rules, which require domain expertise. DNNs are essentially computational graphs, which contain rich structural information. In this paper, we aim to find a suitable compression policy from DNNs' structural information. We propose an automatic graph encoder-decoder model compression (AGMC) method combined with graph neural networks (GNN) and reinforcement learning (RL). We model the target DNN as a graph and use GNN to learn the DNN's embeddings automatically. We compared our method with rule-based DNN embedding model compression methods to show the effectiveness of our method. Results show that our learning-based DNN embedding achieves better performance and a higher compression ratio with fewer search steps. We evaluated our method on over-parameterized and mobile-friendly DNNs and compared our method with handcrafted and learning-based model compression approaches. On over parameterized DNNs, such as ResNet-56, our method outperformed handcrafted and learning-based methods with 4.36% and 2.56% higher accuracy, respectively. Furthermore, on MobileNet-v2, we achieved a higher compression ratio than state-of-the-art methods with just 0.93% accuracy loss.
updated: Tue Nov 09 2021 16:39:02 GMT+0000 (UTC)
published: Wed Nov 25 2020 11:05:21 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト