ディープニューラルネットワーク(DNN)は計算/メモリ集約型であり、敵の攻撃に対して脆弱であるため、一部の実際のアプリケーションでは禁止されています。密なモデルを疎なモデルに変換することにより、プルーニングは計算/メモリコストを削減するための有望なソリューションであるように見えます。このホワイトペーパーでは、分類モデル、特にDNNベースのモデルを研究し、それらのスパース性と敵対的堅牢性の間に固有の関係が存在することを示します。私たちの分析は、理論的および経験的に、非線形DNNベースの分類器は、l_2攻撃の下でいくつかの線形攻撃と異なる動作をすることを明らかにしています。さらに、モデルのスパース性が適切に高いほど、非線形DNNの堅牢性が向上することを示しますが、過分散モデルは敵対的な例に抵抗するのが難しくなります。
Deep neural networks (DNNs) are computationally/memory-intensive and vulnerable to adversarial attacks, making them prohibitive in some real-world applications. By converting dense models into sparse ones, pruning appears to be a promising solution to reducing the computation/memory cost. This paper studies classification models, especially DNN-based ones, to demonstrate that there exists intrinsic relationships between their sparsity and adversarial robustness. Our analyses reveal, both theoretically and empirically, that nonlinear DNN-based classifiers behave differently under l_2 attacks from some linear ones. We further demonstrate that an appropriately higher model sparsity implies better robustness of nonlinear DNNs, whereas over-sparsified models can be more difficult to resist adversarial examples.