arXiv reaDer
PokeBNN:軽量精度のバイナリ追求
PokeBNN: A Binary Pursuit of Lightweight Accuracy
Top-1 ImageNetの最適化は、推論設定では実用的でない可能性のある巨大なネットワークを促進します。バイナリニューラルネットワーク(BNN)は、計算強度を大幅に低下させる可能性がありますが、既存のモデルは低品質に悩まされています。この欠点を克服するために、複数の残差パスの追加や活性化関数の調整などの手法によってBNNの品質を向上させるバイナリ畳み込みブロックであるPokeConvを提案します。これをResNet-50に適用し、2値化が難しいResNetの初期畳み込み層を最適化します。結果として得られるネットワークファミリにPokeBNNという名前を付けます。これらの手法は、トップ1の精度とネットワークのコストの両方で有利な改善をもたらすように選択されています。コストと精度の共同最適化を可能にするために、量子化および2値化されたネットワークのハードウェアおよびエネルギーに触発されたコストメトリックである算術計算エフォート(ACE)を定義します。また、2値化勾配近似を制御する未踏のハイパーパラメータを最適化する必要性を特定します。一般的に使用されるCPU64コスト、ACEコスト、およびネットワークサイズのメトリックとともに、トップ1の精度で新しい強力な最先端(SOTA)を確立します。 ReActNet-BNNの以前のSOTAであるAdamは、7.9 ACEで70.5%のトップ1精度を達成しました。 PokeBNNの小さなバリアントは、2.6 ACEで70.5%のトップ1を達成し、コストを3倍以上削減します。より大きなPokeBNNは、7.8 ACEで75.6%のトップ1を達成し、コストを増やすことなく精度を5%以上向上させます。 JAX / FlaxでのPokeBNNの実装と複製の手順は、AQTリポジトリで入手できます:https://github.com/google/aqt
Optimization of Top-1 ImageNet promotes enormous networks that may be impractical in inference settings. Binary neural networks (BNNs) have the potential to significantly lower the compute intensity but existing models suffer from low quality. To overcome this deficiency, we propose PokeConv, a binary convolution block which improves quality of BNNs by techniques such as adding multiple residual paths, and tuning the activation function. We apply it to ResNet-50 and optimize ResNet's initial convolutional layer which is hard to binarize. We name the resulting network family PokeBNN. These techniques are chosen to yield favorable improvements in both top-1 accuracy and the network's cost. In order to enable joint optimization of the cost together with accuracy, we define arithmetic computation effort (ACE), a hardware- and energy-inspired cost metric for quantized and binarized networks. We also identify a need to optimize an under-explored hyper-parameter controlling the binarization gradient approximation. We establish a new, strong state-of-the-art (SOTA) on top-1 accuracy together with commonly-used CPU64 cost, ACE cost and network size metrics. ReActNet-Adam, the previous SOTA in BNNs, achieved a 70.5% top-1 accuracy with 7.9 ACE. A small variant of PokeBNN achieves 70.5% top-1 with 2.6 ACE, more than 3x reduction in cost; a larger PokeBNN achieves 75.6% top-1 with 7.8 ACE, more than 5% improvement in accuracy without increasing the cost. PokeBNN implementation in JAX/Flax and reproduction instructions are available in AQT repository: https://github.com/google/aqt
updated: Thu Apr 28 2022 19:58:34 GMT+0000 (UTC)
published: Tue Nov 30 2021 22:05:59 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト