arXiv reaDer
敵対者訓練の一般化を改善するための堅牢なローカル機能
Robust Local Features for Improving the Generalization of Adversarial Training
 敵対的な訓練は、敵対的な例を防御するための堅牢なモデルを訓練するための最も効果的な方法の1つとして実証されています。ただし、敵対的に訓練されたモデルには、目に見えないテストデータに対する敵対的に堅牢な一般化が欠けていることがよくあります。最近の研究は、敵対的に訓練されたモデルは、グローバル構造の特徴により偏っていることを示しています。代わりに、この作業では、ロバストなローカルフィーチャが目に見えない形状の変化に対して一般化するため、敵対者トレーニングの一般化とロバストなローカルフィーチャとの関係を調査したいと思います。堅牢なローカル機能を学習するために、ランダムブロックシャッフル(RBS)変換を開発して、通常の敵対者の例でグローバル構造機能を分割します。敵対者訓練のためのロバストな局所特徴(RLFAT)と呼ばれる新しいアプローチを提案し続けます。これは、最初にRBS変換された敵対者の例で敵対者訓練によってロバストな局所特徴を学習し、その後、通常の敵対者例の訓練にロバストな局所特徴を転送します。引数の一般性を示すために、現在の最先端の敵対的トレーニングフレームワークにRLFATを実装します。 STL-10、CIFAR-10、およびCIFAR-100の広範な実験により、RLFATは敵対者のロバストな一般化と敵訓練の標準的な一般化の両方を大幅に改善することが示されています。さらに、モデルが画像上のオブジェクトのより多くの局所的特徴をキャプチャし、人間の知覚とより良く整合することを実証します。
Adversarial training has been demonstrated as one of the most effective methods for training robust models to defend against adversarial examples. However, adversarially trained models often lack adversarially robust generalization on unseen testing data. Recent works show that adversarially trained models are more biased towards global structure features. Instead, in this work, we would like to investigate the relationship between the generalization of adversarial training and the robust local features, as the robust local features generalize well for unseen shape variation. To learn the robust local features, we develop a Random Block Shuffle (RBS) transformation to break up the global structure features on normal adversarial examples. We continue to propose a new approach called Robust Local Features for Adversarial Training (RLFAT), which first learns the robust local features by adversarial training on the RBS-transformed adversarial examples, and then transfers the robust local features into the training of normal adversarial examples. To demonstrate the generality of our argument, we implement RLFAT in currently state-of-the-art adversarial training frameworks. Extensive experiments on STL-10, CIFAR-10 and CIFAR-100 show that RLFAT significantly improves both the adversarially robust generalization and the standard generalization of adversarial training. Additionally, we demonstrate that our models capture more local features of the object on the images, aligning better with human perception.
updated: Sun Feb 02 2020 13:54:45 GMT+0000 (UTC)
published: Mon Sep 23 2019 04:19:34 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト