arXiv reaDer
信頼性の高いディストリビューション ロスレス ネットワーク プルーニングのための効率的なスタイン変分推論
Efficient Stein Variational Inference for Reliable Distribution-lossless Network Pruning
ネットワーク プルーニングは、軽くて正確なモデルを生成し、リソースが限られたエッジ デバイスに展開できるようにするための有望な方法です。ただし、現在の最先端技術では、特定のネットワーク内の有効なサブネットワークとその他の余分なパラメーターが同じ分布を共有していると想定しています。通常、ゼロに近い値を削除します。単純ではありますが、効果的なモデルには多くの小さな値が関連付けられている可能性があるため、最適な方法ではない可能性があります。モデル空間にすでに埋め込まれているゼロに近い値を削除すると、モデルの精度が大幅に低下する可能性があります。別の作業ラインは、人間が作成した事前仮説にまだ依存しているすべての可能なサブ構造に離散事前確率を割り当てることを提案しています。さらに悪いことに、既存の方法は正則化されたポイント推定、つまりハード プルーニングを使用しますが、これはエラー推定を提供できず、プルーニングされたネットワークの信頼性の正当化に失敗します。この論文では、ベイジアン処理内で枝刈りされた宝くじを理論的に見つけるために、DLLP という名前の新しい分布ロスレス枝刈り法を提案します。具体的には、DLLP はバニラ ネットワークを、潜在的な枝刈りされたモデルとその他の冗長性の離散事前確率として再モデル化します。さらに重要なことに、DLLP は Stein Variational Inference を使用して潜在事前確率にアプローチし、未知の分布で KL 発散を計算することを効果的にバイパスします。小規模な Cifar-10 と大規模な ImageNet に基づく広範な実験は、私たちの方法が、プルーニングされたモデルに定量化された信頼性を提供しながら、優れた一般化パフォーマンスを備えたより疎なネットワークを取得できることを示しています。
Network pruning is a promising way to generate light but accurate models and enable their deployment on resource-limited edge devices. However, the current state-of-the-art assumes that the effective sub-network and the other superfluous parameters in the given network share the same distribution, where pruning inevitably involves a distribution truncation operation. They usually eliminate values near zero. While simple, it may not be the most appropriate method, as effective models may naturally have many small values associated with them. Removing near-zero values already embedded in model space may significantly reduce model accuracy. Another line of work has proposed to assign discrete prior over all possible sub-structures that still rely on human-crafted prior hypotheses. Worse still, existing methods use regularized point estimates, namely Hard Pruning, that can not provide error estimations and fail reliability justification for the pruned networks. In this paper, we propose a novel distribution-lossless pruning method, named DLLP, to theoretically find the pruned lottery within Bayesian treatment. Specifically, DLLP remodels the vanilla networks as discrete priors for the latent pruned model and the other redundancy. More importantly, DLLP uses Stein Variational Inference to approach the latent prior and effectively bypasses calculating KL divergence with unknown distribution. Extensive experiments based on small Cifar-10 and large-scaled ImageNet demonstrate that our method can obtain sparser networks with great generalization performance while providing quantified reliability for the pruned model.
updated: Wed Dec 07 2022 09:31:47 GMT+0000 (UTC)
published: Wed Dec 07 2022 09:31:47 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト