arXiv reaDer
FTBNN:1ビットCNNの非線形性を再考し、それを超えて
FTBNN: Rethinking Non-linearity for 1-bit CNNs and Going Beyond
重みとアクティベーションの両方が1ビットに2値化されるバイナリニューラルネットワーク(BNN)は、高度に高速化された計算と大幅に削減されたメモリフットプリントの大きな利点により、リソースに制約のあるデバイスの開発にアピールするため、近年広く研究されています。 BNN構造をトレーニングするための量子化エラーを減らす傾向がある以前の方法とは対照的に、2値化された畳み込みプロセスは、そのようなエラーを最小化するというターゲットに対して線形性を高め、BNNの識別能力を妨げると主張します。このホワイトペーパーでは、適切な非線形モジュールを再調査および調整して、その矛盾を修正し、精度とトレーニング効率の点で大規模なImageNetデータセットで最先端のパフォーマンスを実現する強力なベースラインを導き出します。さらに進むと、提案されたBNNモデルは、精度を失うことなく、効率的な二項演算をより有効に活用することによって、圧縮される可能性がまだ高いことがわかります。さらに、BNNモデルの制限された容量は、グループ実行の助けを借りて増やすこともできます。これらの洞察に基づいて、計算コストを抑えながら、トップ1の精度を4〜5%向上させて、ベースラインを改善することができます。私たちのコードはhttps://github.com/zhuogege1943/ftbnnで公開されます。
Binary neural networks (BNNs), where both weights and activations are binarized into 1 bit, have been widely studied in recent years due to its great benefit of highly accelerated computation and substantially reduced memory footprint that appeal to the development of resource constrained devices. In contrast to previous methods tending to reduce the quantization error for training BNN structures, we argue that the binarized convolution process owns an increasing linearity towards the target of minimizing such error, which in turn hampers BNN's discriminative ability. In this paper, we re-investigate and tune proper non-linear modules to fix that contradiction, leading to a strong baseline which achieves state-of-the-art performance on the large-scale ImageNet dataset in terms of accuracy and training efficiency. To go further, we find that the proposed BNN model still has much potential to be compressed by making a better use of the efficient binary operations, without losing accuracy. In addition, the limited capacity of the BNN model can also be increased with the help of group execution. Based on these insights, we are able to improve the baseline with an additional 4~5% top-1 accuracy gain even with less computational cost. Our code will be made public at https://github.com/zhuogege1943/ftbnn.
updated: Wed Dec 30 2020 09:48:00 GMT+0000 (UTC)
published: Mon Oct 19 2020 08:11:48 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト