arXiv reaDer
HALP:ハードウェア対応のレイテンシープルーニング
HALP: Hardware-Aware Latency Pruning
構造的プルーニングは、ネットワークアーキテクチャを簡素化し、推論速度を向上させることができます。事前定義された予算の下でレイテンシーを抑制しながら精度を最大化することを目的として、グローバルなリソース割り当て最適化問題として構造的プルーニングを定式化するハードウェア対応レイテンシープルーニング(HALP)を提案します。フィルタの重要度のランク付けでは、HALPはレイテンシルックアップテーブルを利用してレイテンシ削減の可能性とグローバルな顕著性スコアを追跡し、精度の低下を測定します。両方のメトリックは、剪定中に非常に効率的に評価できるため、ターゲットの制約が与えられた場合の報酬最大化問題の下で、グローバルな構造的剪定を再定式化できます。これにより、拡張されたナップザックソルバーを介して問題を解決できるようになり、HALPは、剪定の有効性と精度と効率のトレードオフにおいて以前の作業を上回ることができます。 ImageNetおよびVOCデータセットで、さまざまなネットワークを介して、分類タスクと検出タスクの両方でHALPを調べます。特に、ImageNetでのResNet-50 / -101プルーニングの場合、HALPはネットワークスループットをそれぞれ+ 0.3%/-0.2%のトップ1精度の変更で1.60×/ 1.90倍改善します。 VOCでのSSDプルーニングの場合、HALPはわずか0.56mAPの低下でスループットを1.94倍向上させます。 HALPは一貫して従来技術を上回り、時には大きな差があります。
Structural pruning can simplify network architecture and improve inference speed. We propose Hardware-Aware Latency Pruning (HALP) that formulates structural pruning as a global resource allocation optimization problem, aiming at maximizing the accuracy while constraining latency under a predefined budget. For filter importance ranking, HALP leverages latency lookup table to track latency reduction potential and global saliency score to gauge accuracy drop. Both metrics can be evaluated very efficiently during pruning, allowing us to reformulate global structural pruning under a reward maximization problem given target constraint. This makes the problem solvable via our augmented knapsack solver, enabling HALP to surpass prior work in pruning efficacy and accuracy-efficiency trade-off. We examine HALP on both classification and detection tasks, over varying networks, on ImageNet and VOC datasets. In particular, for ResNet-50/-101 pruning on ImageNet, HALP improves network throughput by 1.60×/1.90× with +0.3%/-0.2% top-1 accuracy changes, respectively. For SSD pruning on VOC, HALP improves throughput by 1.94× with only a 0.56 mAP drop. HALP consistently outperforms prior art, sometimes by large margins.
updated: Wed Oct 20 2021 22:34:51 GMT+0000 (UTC)
published: Wed Oct 20 2021 22:34:51 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト