arXiv reaDer
-1、+ 1エンコーディング分解および加速による量子化ニューラルネットワーク
Quantized Neural Networks via -1, +1 Encoding Decomposition and Acceleration
ディープニューラルネットワーク(DNN)のトレーニングには、計算とデータストレージの両方に常に集中的なリソースが必要です。したがって、DNNを携帯電話や組み込み機器に効率的に適用することはできず、産業用アプリケーションへの適用が大幅に制限されます。この問題に対処するために、-1 +1を使用して量子化ニューラルネットワーク(QNN)をマルチブランチバイナリネットワークに分解する新しいエンコーディングスキームを提案します。これは、ビット単位の演算(xnorとbitcount)によって効率的に実装してモデルを実現できます。圧縮、計算アクセラレーション、およびリソース節約。私たちの方法を使用することにより、ユーザーは要件とハードウェアリソースに応じて任意に異なるエンコード精度を達成できます。提案されたメカニズムは、データの保存と計算の観点からFPGAとASICの使用に非常に適しており、スマートチップの実現可能なアイデアを提供します。大規模な画像分類(ImageNetなど)、オブジェクト検出、およびセマンティックセグメンテーションタスクに対するメソッドの有効性を検証します。特に、ロービットエンコーディングを使用する方法では、ハイビットの方法とほぼ同じパフォーマンスを実現できます。
The training of deep neural networks (DNNs) always requires intensive resources for both computation and data storage. Thus, DNNs cannot be efficiently applied to mobile phones and embedded devices, which severely limits their applicability in industrial applications. To address this issue, we propose a novel encoding scheme using -1, +1 to decompose quantized neural networks (QNNs) into multi-branch binary networks, which can be efficiently implemented by bitwise operations (i.e., xnor and bitcount) to achieve model compression, computational acceleration, and resource saving. By using our method, users can achieve different encoding precisions arbitrarily according to their requirements and hardware resources. The proposed mechanism is highly suitable for the use of FPGA and ASIC in terms of data storage and computation, which provides a feasible idea for smart chips. We validate the effectiveness of our method on large-scale image classification (e.g., ImageNet), object detection, and semantic segmentation tasks. In particular, our method with low-bit encoding can still achieve almost the same performance as its high-bit counterparts.
updated: Fri Jun 18 2021 03:11:15 GMT+0000 (UTC)
published: Fri Jun 18 2021 03:11:15 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト