「モノのインターネット」により、ヘルスケア監視システムから自動運転車に至るまでのアプリケーションで、AIベースのエッジコンピューティングに対する需要が高まっています。量子化は、このようなアプリケーションの増大する計算コストに対処するための強力なツールであり、完全な精度のネットワーク上で大幅な圧縮をもたらします。ただし、量子化により、複雑な画像分類タスクのパフォーマンスが大幅に低下する可能性があります。これに対処するために、バイナリネットワークの重要な層を特定し、混合精度ネットワークを設計するための主成分分析(PCA)駆動の方法論を提案します。提案されたHybrid-Netは、XNOR-のエネルギー効率の最大94%を達成しながら、CIFAR-100およびImageNetデータセット上のResNetおよびVGGアーキテクチャのXNOR-Netなどのバイナリネットワークよりも分類精度を10%以上改善します。ネット。この作業により、エッジデバイスでエネルギー効率の高いニューラルコンピューティングに高度に圧縮されたニューラルネットワークを使用する可能性がさらに高まります。
The `Internet of Things' has brought increased demand for AI-based edge computing in applications ranging from healthcare monitoring systems to autonomous vehicles. Quantization is a powerful tool to address the growing computational cost of such applications, and yields significant compression over full-precision networks. However, quantization can result in substantial loss of performance for complex image classification tasks. To address this, we propose a Principal Component Analysis (PCA) driven methodology to identify the important layers of a binary network, and design mixed-precision networks. The proposed Hybrid-Net achieves a more than 10% improvement in classification accuracy over binary networks such as XNOR-Net for ResNet and VGG architectures on CIFAR-100 and ImageNet datasets while still achieving up to 94% of the energy-efficiency of XNOR-Nets. This work furthers the feasibility of using highly compressed neural networks for energy-efficient neural computing in edge devices.