arXiv reaDer
Arch-Net:アーキテクチャにとらわれないモデル展開のためのモデル蒸留
Arch-Net: Model Distillation for Architecture Agnostic Model Deployment
ディープニューラルネットワークの計算能力に対する膨大な要件は、実際のアプリケーションにとって大きなハードルです。最近の多くの特定用途向け集積回路(ASIC)チップは、ニューラルネットワークアクセラレーション専用のハードウェアサポートを備えています。ただし、ASICの開発には数年かかるため、Neural ArchitectureResearchの最新の開発によって必然的に追い越されます。たとえば、Transformer Networksは、多くの一般的なチップをネイティブでサポートしていないため、展開が困難です。この論文では、ASICのほとんどのアーキテクチャで効率的にサポートされているオペレータのみで構成されるニューラルネットワークのファミリであるArch-Netを提案します。 Arch-Netが作成されると、レイヤーの正規化や埋め込みレイヤーなどのあまり一般的ではないネットワーク構造が、ラベルのないBlockwise Model Distillationによって段階的に排除され、同時にサブ8ビットの量子化が実行されてパフォーマンスが最大化されます。機械翻訳と画像分類タスクの経験的結果により、最新の開発されたニューラルアーキテクチャを、複数の大量生産されたASICチップに展開できる、高速で正確なArch-Netに変換できることが確認されています。コードはhttps://github.com/megvii-research/Arch-Netで入手できます。
Vast requirement of computation power of Deep Neural Networks is a major hurdle to their real world applications. Many recent Application Specific Integrated Circuit (ASIC) chips feature dedicated hardware support for Neural Network Acceleration. However, as ASICs take multiple years to develop, they are inevitably out-paced by the latest development in Neural Architecture Research. For example, Transformer Networks do not have native support on many popular chips, and hence are difficult to deploy. In this paper, we propose Arch-Net, a family of Neural Networks made up of only operators efficiently supported across most architectures of ASICs. When a Arch-Net is produced, less common network constructs, like Layer Normalization and Embedding Layers, are eliminated in a progressive manner through label-free Blockwise Model Distillation, while performing sub-eight bit quantization at the same time to maximize performance. Empirical results on machine translation and image classification tasks confirm that we can transform latest developed Neural Architectures into fast running and as-accurate Arch-Net, ready for deployment on multiple mass-produced ASIC chips. The code will be available at https://github.com/megvii-research/Arch-Net.
updated: Mon Apr 11 2022 03:03:58 GMT+0000 (UTC)
published: Mon Nov 01 2021 15:49:32 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト