arXiv reaDer
正確で信頼性が高く高速な堅牢性評価
Accurate, reliable and fast robustness evaluation
 過去5年間、ニューラルネットワークの最小の敵対的摂動に対する感受性は、特有の現象からディープラーニングの中心的な問題に移行しました。しかし、多くの注意にもかかわらず、より堅牢なモデルへの進歩は、ニューラルネットワークモデルの堅牢性を評価することの困難さによって著しく損なわれています。今日の方法は、高速であるが脆弱である(勾配ベースの攻撃)か、かなり信頼できるが低速である(スコアベースおよび意思決定ベースの攻撃)。ここでは、(a)勾配マスキングに対して他の勾配ベースの攻撃よりも信頼性が高く、(b)現在の状態よりもパフォーマンスが高く、クエリ効率が高い、勾配ベースの攻撃の新しいセットを開発します-c勾配ベースの攻撃。(c)広範囲の敵対的基準に柔軟に適応でき、(d)ハイパーパラメーターの調整を実質的に必要としません。これらの調査結果は、6つの異なるモデルの多様なセットで慎重に検証され、ターゲットシナリオと非ターゲットシナリオの両方でL0、L1、L2、およびLinfを保持します。実装はすべての主要なツールボックス(Foolbox、CleverHans、ART)ですぐに利用可能になります。このクラスの攻撃により、堅牢性評価がより簡単で信頼性が高まり、より堅牢な機械学習モデルの検索においてより多くのシグナルに貢献することを願っています。
Throughout the past five years, the susceptibility of neural networks to minimal adversarial perturbations has moved from a peculiar phenomenon to a core issue in Deep Learning. Despite much attention, however, progress towards more robust models is significantly impaired by the difficulty of evaluating the robustness of neural network models. Today's methods are either fast but brittle (gradient-based attacks), or they are fairly reliable but slow (score- and decision-based attacks). We here develop a new set of gradient-based adversarial attacks which (a) are more reliable in the face of gradient-masking than other gradient-based attacks, (b) perform better and are more query efficient than current state-of-the-art gradient-based attacks, (c) can be flexibly adapted to a wide range of adversarial criteria and (d) require virtually no hyperparameter tuning. These findings are carefully validated across a diverse set of six different models and hold for L0, L1, L2 and Linf in both targeted as well as untargeted scenarios. Implementations will soon be available in all major toolboxes (Foolbox, CleverHans and ART). We hope that this class of attacks will make robustness evaluations easier and more reliable, thus contributing to more signal in the search for more robust machine learning models.
updated: Thu Dec 12 2019 18:32:51 GMT+0000 (UTC)
published: Mon Jul 01 2019 18:18:10 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト