arXiv reaDer
分類による二値化:ソフト機能は本当に必要ですか?
Binarizing by Classification: Is soft function really necessary?
バイナリニューラルネットワークは、符号関数を利用して実際の値を2値化し、その非微分特性は、バックプロパゲーション中に必然的に大きな勾配エラーをもたらします。勾配を近似するために多くの手作業で設計されたソフト関数が提案されていますが、それらのメカニズムは明確ではなく、バイナリモデルとそれらの完全精度のモデルとの間には依然として大きなパフォーマンスギャップがあります。これに対処するために、二項分類問題としてネットワークの二項化に取り組み、分類子として多層パーセプトロン(MLP)を使用することを提案します。 MLPベースの分類器は、理論的には任意の連続関数に適合でき、特定のソフト関数なしでネットワークを2値化し、勾配を逆伝播するように適応的に学習されます。この観点から、単純な線形関数でさえ、以前の複雑なソフト関数よりも優れていることを実験的に証明します。広範な実験は、提案された方法が画像分類と人間の姿勢推定タスクの両方で驚くべきパフォーマンスをもたらすことを示しています。具体的には、ImageNetデータセットでResNet-34の65.7%のトップ1精度を達成し、絶対的な改善は2.8%です。やりがいのあるMicrosoftCOCOキーポイントデータセットを評価する場合、提案された方法により、バイナリネットワークは、いくつかの完全精度の方法と同等の60.6のmAPを初めて達成できます。
Binary neural network leverages the Sign function to binarize real values, and its non-derivative property inevitably brings huge gradient errors during backpropagation. Although many hand-designed soft functions have been proposed to approximate gradients, their mechanism is not clear and there are still huge performance gaps between binary models and their full-precision counterparts. To address this, we propose to tackle network binarization as a binary classification problem and use a multi-layer perceptron (MLP) as the classifier. The MLP-based classifier can fit any continuous function theoretically and is adaptively learned to binarize networks and backpropagate gradients without any specific soft function. With this view, we further prove experimentally that even a simple linear function can outperform previous complex soft functions. Extensive experiments demonstrate that the proposed method yields surprising performance both in image classification and human pose estimation tasks. Specifically, we achieve 65.7% top-1 accuracy of ResNet-34 on ImageNet dataset, with an absolute improvement of 2.8%. When evaluating on the challenging Microsoft COCO keypoint dataset, the proposed method enables binary networks to achieve a mAP of 60.6 for the first time, on par with some full-precision methods.
updated: Mon May 16 2022 02:47:41 GMT+0000 (UTC)
published: Mon May 16 2022 02:47:41 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト