arXiv reaDer
ハードウェアを考慮した効率的なブロック設計のための算術強度バランシング畳み込み
Arithmetic Intensity Balancing Convolution for Hardware-aware Efficient Block Design
ディープ ラーニングの進歩に伴い、エッジ デバイスと軽量ニューラル ネットワークの重要性が増しています。 AI アクセラレータのレイテンシを短縮するには、FLOP を削減するだけでなく、ハードウェア パフォーマンスを向上させることが不可欠です。空間サイズが小さい畳み込みの小さな重み演算強度によって全体的な強度が制限されるという問題に対処するために、算術強度バランシング畳み込み (ABConv) を提案しました。 ABConv は、精度を犠牲にすることなく、全体的な演算強度の上限を引き上げ、レイテンシを大幅に削減しました。さまざまな構成で Arm Ethos-U65 NPU 上の ABConv のレイテンシとハードウェア パフォーマンスをテストし、CIFAR100 の画像分類で MobileNetV1 と ResNet50 の一部を置き換えるために使用しました。
As deep learning advances, edge devices and lightweight neural networks are becoming more important. To reduce latency in the AI accelerator, it's essential to not only reduce FLOPs but also enhance hardware performance. We proposed an arithmetic intensity balancing convolution (ABConv) to address the issue of the overall intensity being limited by the small weight arithmetic intensity for convolution with a small spatial size. ABConv increased the maximum bound of overall arithmetic intensity and significantly reduced latency, without sacrificing accuracy. We tested the latency and hardware performance of ABConv on the Arm Ethos-U65 NPU in various configurations and used it to replace some of MobileNetV1 and ResNet50 in image classification for CIFAR100.
updated: Sat Apr 08 2023 14:06:54 GMT+0000 (UTC)
published: Sat Apr 08 2023 14:06:54 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト