arXiv reaDer
敵対的に訓練されたモデルの平滑化された推論
Smoothed Inference for Adversarially-Trained Models
 ディープニューラルネットワークは、敵対攻撃に対して脆弱であることが知られています。このような攻撃からの現在の防御方法は、暗黙的または明示的な正則化、たとえば敵対者の訓練に基づいています。サンプルを中心とするランダム分布での分類器出力の平均化であるランダム化平滑化は、入力の制限された摂動を受ける分類器のパフォーマンスを保証することが示されています。この作業では、乱れのないデータのパフォーマンスを改善する方法として、また、攻撃に対する堅牢性を高める方法として、ランダム化された平滑化の適用を研究します。提案された手法は、既存の敵対的な防御の上に適用できますが、ランダム化されたアプローチで特にうまく機能します。一般的なホワイトボックス(PGD)攻撃とCIFAR-10およびCIFAR-100のブラックボックス(転送およびNAttack)攻撃でのパフォーマンスを調べ、ほとんどのシナリオで従来の技術を大幅に上回り、他のシナリオと同等です。たとえば、ResNet-20を使用したCIFAR-10に対するPGD攻撃では60.4%の精度を達成し、従来の技術を11.7%上回る性能を発揮しました。この方法はサンプリングに基づいているため、モデル推論の複雑さとそのパフォーマンスの間のトレードオフに適しています。提案された手法のリファレンス実装は、https://github.com/yanemcovsky/SIAMで提供されています
Deep neural networks are known to be vulnerable to adversarial attacks. Current methods of defense from such attacks are based on either implicit or explicit regularization, e.g., adversarial training. Randomized smoothing, the averaging of the classifier outputs over a random distribution centered in the sample, has been shown to guarantee the performance of a classifier subject to bounded perturbations of the input. In this work, we study the application of randomized smoothing as a way to improve performance on unperturbed data as well as to increase robustness to adversarial attacks. The proposed technique can be applied on top of any existing adversarial defense, but works particularly well with the randomized approaches. We examine its performance on common white-box (PGD) and black-box (transfer and NAttack) attacks on CIFAR-10 and CIFAR-100, substantially outperforming previous art for most scenarios and comparable on others. For example, we achieve 60.4% accuracy under a PGD attack on CIFAR-10 using ResNet-20, outperforming previous art by 11.7%. Since our method is based on sampling, it lends itself well for trading-off between the model inference complexity and its performance. A reference implementation of the proposed techniques is provided at https://github.com/yanemcovsky/SIAM
updated: Mon Mar 16 2020 14:13:03 GMT+0000 (UTC)
published: Sun Nov 17 2019 09:38:45 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト