自動運転車やウェアラブルヘルスモニターなどの安全性に敏感なアプリケーションに組み込まれたニューラルネットワークは、後知恵分析のための入力属性と、エッジコンピューティングのためにサイズを縮小するためのネットワーク圧縮という2つの重要な手法に依存しています。このホワイトペーパーでは、ネットワーク圧縮によって生成された属性が変形し、ミッションクリティカルなアプリケーションに悲惨な結果をもたらす可能性があるため、これらの一見無関係な手法が互いに競合することを示します。この現象は、従来のネットワーク圧縮方法では、属性の品質を無視して、ネットワークの予測のみを保持するという事実が原因で発生します。アトリビューションの不整合の問題に対処するために、ネットワークを圧縮しながらアトリビューションを保持できるフレームワークを提示します。加重折りたたみアトリビューションマッチング正則化を採用することにより、圧縮されているネットワークのアトリビューションマップを圧縮前の以前の自己に一致させます。さまざまな圧縮方法で、アルゴリズムの有効性を定量的および定性的に示します。
Neural networks embedded in safety-sensitive applications such as self-driving cars and wearable health monitors rely on two important techniques: input attribution for hindsight analysis and network compression to reduce its size for edge-computing. In this paper, we show that these seemingly unrelated techniques conflict with each other as network compression deforms the produced attributions, which could lead to dire consequences for mission-critical applications. This phenomenon arises due to the fact that conventional network compression methods only preserve the predictions of the network while ignoring the quality of the attributions. To combat the attribution inconsistency problem, we present a framework that can preserve the attributions while compressing a network. By employing the Weighted Collapsed Attribution Matching regularizer, we match the attribution maps of the network being compressed to its pre-compression former self. We demonstrate the effectiveness of our algorithm both quantitatively and qualitatively on diverse compression methods.