arXiv reaDer
SME:ニューラルネットワークのビットスパース性を絞り出すためのReRAMベースのスパース乗算エンジン
SME: ReRAM-based Sparse-Multiplication-Engine to Squeeze-Out Bit Sparsity of Neural Network
抵抗変化型メモリ(ReRAM)クロスバーは、ベクトル行列乗算および累積(VMM)のメモリ内およびその場でのアナログ計算機能のおかげで、ディープニューラルネットワーク(DNN)アクセラレーターの有望な手法です。ただし、クロスバーアーキテクチャがDNNのスパース性を利用することは困難です。密結合のクロスバー構造の制限により、必然的に複雑でコストのかかる制御が細粒度のスパース性を利用する原因になります。対策として、ハードウェアとソフトウェアの共同設計フレームワークに基づいて、Sparse-Multiplication-Engine(SME)という名前の新しいReRAMベースのDNNアクセラレータを開発しました。まず、既存の量子化手法に基づいて、ビットスパースパターンを調整してビットスパース性の密度を高めます。次に、クロスバー全体でウェイトのビットをスライスし、アクティブ化の結果を周辺回路に接続するための新しいウェイトマッピングメカニズムを提案します。このメカニズムは、密結合のクロスバー構造を切り離し、クロスバーのスパース性を累積することができます。最後に、優れたスクイーズアウトスキームにより、前の2つのステップで非常にスパースな非ゼロでマップされたクロスバーが空になります。 SMEアーキテクチャを設計し、他の量子化手法やさまざまなReRAMセルテクノロジでの使用について説明します。以前の最先端の設計と比較して、SMEは、Resent-50とMobileNet-v2を使用して、クロスバーの使用をそれぞれ最大8.7倍と2.1倍に縮小し、ImageNetでの精度の低下は0.3%未満です。
Resistive Random-Access-Memory (ReRAM) crossbar is a promising technique for deep neural network (DNN) accelerators, thanks to its in-memory and in-situ analog computing abilities for Vector-Matrix Multiplication-and-Accumulations (VMMs). However, it is challenging for crossbar architecture to exploit the sparsity in the DNN. It inevitably causes complex and costly control to exploit fine-grained sparsity due to the limitation of tightly-coupled crossbar structure. As the countermeasure, we developed a novel ReRAM-based DNN accelerator, named Sparse-Multiplication-Engine (SME), based on a hardware and software co-design framework. First, we orchestrate the bit-sparse pattern to increase the density of bit-sparsity based on existing quantization methods. Second, we propose a novel weigh mapping mechanism to slice the bits of a weight across the crossbars and splice the activation results in peripheral circuits. This mechanism can decouple the tightly-coupled crossbar structure and cumulate the sparsity in the crossbar. Finally, a superior squeeze-out scheme empties the crossbars mapped with highly-sparse non-zeros from the previous two steps. We design the SME architecture and discuss its use for other quantization methods and different ReRAM cell technologies. Compared with prior state-of-the-art designs, the SME shrinks the use of crossbars up to 8.7x and 2.1x using Resent-50 and MobileNet-v2, respectively, with less than 0.3% accuracy drop on ImageNet.
updated: Tue Mar 02 2021 13:27:15 GMT+0000 (UTC)
published: Tue Mar 02 2021 13:27:15 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト