arXiv reaDer
分類による二値化: ソフト関数は本当に必要ですか?
Binarizing by Classification: Is soft function really necessary?
バイナリ ニューラル ネットワークは、Sign 関数を利用して重みとアクティベーションを 2 値化します。これには、微分不可能性を克服するために勾配推定器が必要であり、バックプロパゲーション中に必然的に勾配誤差が生じます。勾配をより適切に近似するための勾配推定器として、手動で設計された多くのソフト関数が提案されていますが、そのメカニズムは明確ではなく、バイナリ モデルとその完全精度の対応物との間には依然として大きなパフォーマンスのギャップが存在します。これらの問題に対処し、勾配誤差を減らすために、二値分類問題としてネットワーク二値化に取り組み、前方パスの分類器として多層パーセプトロン (MLP) を使用し、後方パスの勾配推定器として使用することを提案します。任意の連続関数に適合する MLP の理論的機能の利点を利用して、ソフト関数の事前知識がなくても、ネットワークの 2 値化と勾配の逆伝播を適応的に学習できます。この観点から、我々はさらに、単純な線形関数であっても、以前の複雑なソフト関数よりも優れたパフォーマンスを発揮できることを経験的に正当化します。広範な実験により、提案された方法が画像分類タスクと人間の姿勢推定タスクの両方で驚くべきパフォーマンスを生み出すことが実証されました。具体的には、ImageNet データセット上で ResNet-34 のトップ 1 精度 65.7% を達成し、絶対的な改善率は 2.6% です。さらに、姿勢推定モデルの軽量化アプローチとして二値化を採用し、適切に設計されたバイナリ姿勢推定ネットワーク SBPN および BHRNet を提案します。困難な Microsoft COCO キーポイント データセットを評価する場合、提案された方法により、バイナリ ネットワークが初めて最大 60.6 の mAP を達成できるようになります。実際のプラットフォームで行われた実験では、特に計算リソースが非常に少ない場合に、BNN がパフォーマンスと計算の複雑さの間でより良いバランスを達成できることが実証されています。
Binary neural networks leverage Sign function to binarize weights and activations, which require gradient estimators to overcome its non-differentiability and will inevitably bring gradient errors during backpropagation. Although many hand-designed soft functions have been proposed as gradient estimators to better approximate gradients, their mechanism is not clear and there are still huge performance gaps between binary models and their full-precision counterparts. To address these issues and reduce gradient error, we propose to tackle network binarization as a binary classification problem and use a multi-layer perceptron (MLP) as the classifier in the forward pass and gradient estimator in the backward pass. Benefiting from the MLP's theoretical capability to fit any continuous function, it can be adaptively learned to binarize networks and backpropagate gradients without any prior knowledge of soft functions. From this perspective, we further empirically justify that even a simple linear function can outperform previous complex soft functions. Extensive experiments demonstrate that the proposed method yields surprising performance both in image classification and human pose estimation tasks. Specifically, we achieve 65.7% top-1 accuracy of ResNet-34 on ImageNet dataset, with an absolute improvement of 2.6%. Moreover, we take binarization as a lightweighting approach for pose estimation models and propose well-designed binary pose estimation networks SBPN and BHRNet. When evaluating on the challenging Microsoft COCO keypoint dataset, the proposed method enables binary networks to achieve a mAP of up to 60.6 for the first time. Experiments conducted on real platforms demonstrate that BNN achieves a better balance between performance and computational complexity, especially when computational resources are extremely low.
updated: Sun Jul 16 2023 07:22:19 GMT+0000 (UTC)
published: Mon May 16 2022 02:47:41 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト