処理インメモリ(PIM)アクセラレータなどのアナログコンピューティングハードウェアは、ニューラルネットワークの計算を高速化するために徐々に注目を集めています。ただし、PIMアクセラレータは物理コンポーネントに固有のノイズに悩まされることが多く、ニューラルネットワークモデルがデジタルハードウェアと同じパフォーマンスを実現することは困難です。固有ノイズを軽減する以前の作業は、ノイズモデルの知識を前提としており、それに応じてニューラルネットワークを再トレーニングする必要がありました。この論文では、あらゆるノイズ設定に対してロバストなニューラルネットワークパフォーマンスを実現するためのノイズにとらわれない方法を提案します。私たちの重要な観察は、パフォーマンスの低下は、ノイズによって引き起こされるネットワークアクティベーションの分布シフトによるものであるということです。シフトを適切に追跡し、偏った分布を較正するために、アナログ環境に固有の変動ノイズの下でアクティベーションの分布を調整できる「ノイズ認識」バッチ正規化レイヤーを提案します。私たちの方法はシンプルで実装が簡単で、さまざまなノイズ設定に一般的であり、モデルを再トレーニングする必要はありません。分類、オブジェクト検出、セマンティックセグメンテーションなど、コンピュータビジョンのいくつかのタスクで実験を行います。結果は、既存の方法よりも信頼性が高く、幅広いノイズ設定の下で堅牢なパフォーマンスを達成する、私たちの方法の有効性を示しています。私たちのシンプルでありながら一般的な方法は、ニューラルネットワークへのアナログコンピューティングデバイスの採用を促進できると信じています。
Analog computing hardwares, such as Processing-in-memory (PIM) accelerators, have gradually received more attention for accelerating the neural network computations. However, PIM accelerators often suffer from intrinsic noise in the physical components, making it challenging for neural network models to achieve the same performance as on the digital hardware. Previous works in mitigating intrinsic noise assumed the knowledge of the noise model, and retraining the neural networks accordingly was required. In this paper, we propose a noise-agnostic method to achieve robust neural network performance against any noise setting. Our key observation is that the degradation of performance is due to the distribution shifts in network activations, which are caused by the noise. To properly track the shifts and calibrate the biased distributions, we propose a "noise-aware" batch normalization layer, which is able to align the distributions of the activations under variational noise inherent in the analog environments. Our method is simple, easy to implement, general to various noise settings, and does not need to retrain the models. We conduct experiments on several tasks in computer vision, including classification, object detection and semantic segmentation. The results demonstrate the effectiveness of our method, achieving robust performance under a wide range of noise settings, more reliable than existing methods. We believe that our simple yet general method can facilitate the adoption of analog computing devices for neural networks.