arXiv reaDer
最適なニューラルネットワークの蒸留:多様な空間での迅速な検索
Distilling Optimal Neural Networks: Rapid Search in Diverse Spaces
この作品は、複数の異なるハードウェアプラットフォームとユーザーシナリオを対象とした、迅速なニューラルアーキテクチャ検索と検索スペース探索のための新しいパイプラインであるDONNA(Distilling Optimal Neural Network Architectures)を紹介します。 DONNAでは、検索は3つのフェーズで構成されます。まず、ブロックごとの知識蒸留を使用して、多様な検索空間の精度予測子が構築されます。この予測子を使用すると、レイヤータイプ、アテンションメカニズム、チャネル幅などのさまざまなマクロアーキテクチャネットワークパラメーターや、ブロックリピート、カーネルサイズ、拡張率などのマイクロアーキテクチャパラメーター全体を検索できます。第2に、急速な進化的検索フェーズでは、予測子とデバイス上の測定値を使用して、シナリオの精度と遅延の観点からパレート最適なアーキテクチャのセットを見つけます。第三に、パレート最適モデルは、完全な精度にすばやく微調整できます。このアプローチにより、DONNAは最先端のアーキテクチャを上回るアーキテクチャを見つけます。 ImageNet分類では、DONNAによって検出されたアーキテクチャはNvidia V100 GPUのEfficientNet-B0およびMobileNetV2よりも同様の精度で20%速く、Samsung S20スマートフォンのMobileNetV2-1.4xよりも0.5%高い精度で10%高速です。ニューラルアーキテクチャの検索に加えて、DONNAは検索空間の探索とハードウェア対応のモデル圧縮に使用されます。
This work presents DONNA (Distilling Optimal Neural Network Architectures), a novel pipeline for rapid neural architecture search and search space exploration, targeting multiple different hardware platforms and user scenarios. In DONNA, a search consists of three phases. First, an accuracy predictor is built for a diverse search space using blockwise knowledge distillation. This predictor enables searching across diverse macro-architectural network parameters such as layer types, attention mechanisms, and channel widths, as well as across micro-architectural parameters such as block repeats, kernel sizes, and expansion rates. Second, a rapid evolutionary search phase finds a Pareto-optimal set of architectures in terms of accuracy and latency for any scenario using the predictor and on-device measurements. Third, Pareto-optimal models can be quickly finetuned to full accuracy. With this approach, DONNA finds architectures that outperform the state of the art. In ImageNet classification, architectures found by DONNA are 20% faster than EfficientNet-B0 and MobileNetV2 on a Nvidia V100 GPU at similar accuracy and 10% faster with 0.5% higher accuracy than MobileNetV2-1.4x on a Samsung S20 smartphone. In addition to neural architecture search, DONNA is used for search-space exploration and hardware-aware model compression.
updated: Wed Dec 16 2020 11:00:19 GMT+0000 (UTC)
published: Wed Dec 16 2020 11:00:19 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト