arXiv reaDer
知覚的に整列した勾配は、敵対的なロバストネスを意味しますか?
Do Perceptually Aligned Gradients Imply Adversarial Robustness?
過去10年間で、ディープラーニングベースのネットワークは、画像分類を含む多くのタスクで前例のない成功を収めてきました。この驚くべき成果にもかかわらず、最近の研究は、そのようなネットワークが、敵対的な例としても知られている小さな悪意のある摂動によって簡単にだまされることを示しています。このセキュリティの弱点は、堅牢なモデルを取得することを目的とした広範な研究につながりました。そのようなモデルの明確なロバスト性の利点を超えて、入力に関するそれらの勾配が人間の知覚と一致することも観察されました。いくつかの研究は、知覚的に整列した勾配(PAG)を強力なトレーニングの副産物として特定しましたが、それを独立した現象と見なしたり、それ自体の意味を研究したりしたものはありません。この作業では、この特性に焦点を当て、知覚的に整列した勾配がロバスト性を意味するかどうかをテストします。この目的のために、分類器のトレーニングでPAGを直接促進する新しい目的を開発し、そのような勾配を持つモデルが敵対的な攻撃に対してより堅牢であるかどうかを調べます。 CIFAR-10とSTLに関する広範な実験により、このようなモデルの堅牢なパフォーマンスが向上し、PAGと堅牢性の間の驚くべき双方向接続が明らかになっていることが検証されています。
In the past decade, deep learning-based networks have achieved unprecedented success in numerous tasks, including image classification. Despite this remarkable achievement, recent studies have demonstrated that such networks are easily fooled by small malicious perturbations, also known as adversarial examples. This security weakness led to extensive research aimed at obtaining robust models. Beyond the clear robustness benefits of such models, it was also observed that their gradients with respect to the input align with human perception. Several works have identified Perceptually Aligned Gradients (PAG) as a byproduct of robust training, but none have considered it as a standalone phenomenon nor studied its own implications. In this work, we focus on this trait and test whether Perceptually Aligned Gradients imply Robustness. To this end, we develop a novel objective to directly promote PAG in training classifiers and examine whether models with such gradients are more robust to adversarial attacks. Extensive experiments on CIFAR-10 and STL validate that such models have improved robust performance, exposing the surprising bidirectional connection between PAG and robustness.
updated: Fri Jul 22 2022 23:48:26 GMT+0000 (UTC)
published: Fri Jul 22 2022 23:48:26 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト