arXiv reaDer
ノイズの多いニューラルネットワークのノイズ除去:補償を伴うベイズアプローチ
Denoising Noisy Neural Networks: A Bayesian Approach with Compensation
ノイズのある重みを持つディープニューラルネットワーク(DNN)は、ノイズのあるニューラルネットワーク(NoisyNN)と呼ばれ、ノイズが存在する場合のDNNのトレーニングと推論から発生します。 NoisyNNは、DNNのワイヤレス伝送、アナログデバイスでのDNNの効率的な展開または保存、DNNの重みの切り捨てまたは量子化など、多くの新しいアプリケーションで登場します。このホワイトペーパーでは、NoisyNNの基本的な問題、つまり、ノイズの多い兆候からDNNの重みを再構築する方法について説明します。以前のすべての作業は最尤(ML)推定に依存していましたが、このペーパーでは、再構築されたモデルの推論精度を最大化することを目的として、DNNを再構築するためのノイズ除去アプローチを提示します。デノイザーの優位性は、2次ニューラルネットワーク関数と浅いフィードフォワードニューラルネットワークをそれぞれ検討する2つの小規模な問題で厳密に証明されています。最新のDNNアーキテクチャを使用した高度な学習タスクに適用すると、デノイザーはML推定器よりも大幅に優れたパフォーマンスを発揮します。ノイズ除去されたDNNモデルの平均テスト精度と、ノイズパワー比(WNR)のパフォーマンスに対する重みの分散を考慮してください。ノイズの多い推論から生じるノイズの多いBERTモデルのノイズを除去する場合、ノイズ除去装置はML推定より1.1 dB優れており、75%のテスト精度を達成します。ノイズの多いトレーニングから生じるノイズの多いResNet18モデルのノイズを除去する場合、ノイズ除去装置はML推定よりも13.4dBおよび8.3dB優れており、それぞれ60%および80%のテスト精度を達成します。
Deep neural networks (DNNs) with noisy weights, which we refer to as noisy neural networks (NoisyNNs), arise from the training and inference of DNNs in the presence of noise. NoisyNNs emerge in many new applications, including the wireless transmission of DNNs, the efficient deployment or storage of DNNs in analog devices, and the truncation or quantization of DNN weights. This paper studies a fundamental problem of NoisyNNs: how to reconstruct the DNN weights from their noisy manifestations. While all prior works relied on the maximum likelihood (ML) estimation, this paper puts forth a denoising approach to reconstruct DNNs with the aim of maximizing the inference accuracy of the reconstructed models. The superiority of our denoiser is rigorously proven in two small-scale problems, wherein we consider a quadratic neural network function and a shallow feedforward neural network, respectively. When applied to advanced learning tasks with modern DNN architectures, our denoiser exhibits significantly better performance than the ML estimator. Consider the average test accuracy of the denoised DNN model versus the weight variance to noise power ratio (WNR) performance. When denoising a noisy BERT model arising from noisy inference, our denoiser outperforms ML estimation by 1.1 dB to achieve a test accuracy of 75%. When denoising a noisy ResNet18 model arising from noisy training, our denoiser outperforms ML estimation by 13.4 dB and 8.3 dB to achieve a test accuracy of 60% and 80%, respectively.
updated: Wed Dec 15 2021 15:23:27 GMT+0000 (UTC)
published: Sat May 22 2021 11:51:20 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト