arXiv reaDer
より堅牢な一般化のための地域の敵対的訓練
Regional Adversarial Training for Better Robust Generalization
敵対者訓練(AT)は、さまざまな敵対者の攻撃に対する最も有望な防御方法の1つとして実証されています。私たちの知る限り、既存のATベースの方法は通常、局所的に最も敵対的な摂動点でトレーニングし、すべての摂動点を等しく扱います。これにより、テストデータの敵対的なロバストな一般化がかなり弱くなる可能性があります。この作業では、良性サンプルの近くの摂動点の多様性と特性を考慮した新しい敵対的トレーニングフレームワークを紹介します。フレームワークを実現するために、我々は、投影勾配降下法(PGD)の典型的な反復攻撃法によって生成された攻撃経路を最初に利用し、攻撃経路に基づいて敵対領域を構築する地域敵対訓練(RAT)防御法を提案します。次に、RATは、この領域内のさまざまな摂動トレーニングポイントを効率的にサンプリングし、距離を意識したラベル平滑化メカニズムを利用して、さまざまな場所の摂動ポイントがモデルのパフォーマンスにさまざまな影響を与えるはずであるという直感をキャプチャします。いくつかのベンチマークデータセットでの広範な実験は、RATが標準的な敵対的トレーニング(SAT)を一貫して大幅に改善し、より堅牢な一般化を示すことを示しています。
Adversarial training (AT) has been demonstrated as one of the most promising defense methods against various adversarial attacks. To our knowledge, existing AT-based methods usually train with the locally most adversarial perturbed points and treat all the perturbed points equally, which may lead to considerably weaker adversarial robust generalization on test data. In this work, we introduce a new adversarial training framework that considers the diversity as well as characteristics of the perturbed points in the vicinity of benign samples. To realize the framework, we propose a Regional Adversarial Training (RAT) defense method that first utilizes the attack path generated by the typical iterative attack method of projected gradient descent (PGD), and constructs an adversarial region based on the attack path. Then, RAT samples diverse perturbed training points efficiently inside this region, and utilizes a distance-aware label smoothing mechanism to capture our intuition that perturbed points at different locations should have different impact on the model performance. Extensive experiments on several benchmark datasets show that RAT consistently makes significant improvement on standard adversarial training (SAT), and exhibits better robust generalization.
updated: Thu Sep 02 2021 02:48:02 GMT+0000 (UTC)
published: Thu Sep 02 2021 02:48:02 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト