arXiv reaDer
Adv-4-Adv:敵対的ドメイン適応を介して変化する敵対的摂動を阻止する
Adv-4-Adv: Thwarting Changing Adversarial Perturbations via Adversarial Domain Adaptation
敵対的訓練は特定の敵対的摂動に対して有用である可能性がありますが、訓練に使用される攻撃から逸脱した攻撃に向けて一般化するのにも効果がないことが証明されています。ただし、この非効率性は本質的にドメイン適応性に関連していることを観察します。これは、敵対的なドメイン適応が有望な解決策であると思われるディープラーニングのもう1つの重要な問題です。したがって、我々は、目に見えない敵対的摂動に対するロバスト性を維持することを目的とした新しい敵対的訓練方法として、Adv-4-Advを提案した。基本的に、Adv-4-Advは、さまざまな摂動が発生する攻撃を別個のドメインとして扱い、敵対的なドメイン適応の力を活用することで、ドメイン/攻撃固有の機能を削除することを目的としています。これにより、トレーニングされたモデルは堅牢なドメイン不変表現を学習するようになり、その一般化能力が強化されます。ファッションに関する広範な評価-MNIST、SVHN、CIFAR-10、およびCIFAR-100は、単純な攻撃(FGSMなど)によって作成されたサンプルに基づいてAdv-4-Advによってトレーニングされたモデルを、より高度な攻撃(たとえば、 PGD)であり、パフォーマンスはこれらのデータセットに関する最新の提案を上回っています。
Whereas adversarial training can be useful against specific adversarial perturbations, they have also proven ineffective in generalizing towards attacks deviating from those used for training. However, we observe that this ineffectiveness is intrinsically connected to domain adaptability, another crucial issue in deep learning for which adversarial domain adaptation appears to be a promising solution. Consequently, we proposed Adv-4-Adv as a novel adversarial training method that aims to retain robustness against unseen adversarial perturbations. Essentially, Adv-4-Adv treats attacks incurring different perturbations as distinct domains, and by leveraging the power of adversarial domain adaptation, it aims to remove the domain/attack-specific features. This forces a trained model to learn a robust domain-invariant representation, which in turn enhances its generalization ability. Extensive evaluations on Fashion-MNIST, SVHN, CIFAR-10, and CIFAR-100 demonstrate that a model trained by Adv-4-Adv based on samples crafted by simple attacks (e.g., FGSM) can be generalized to more advanced attacks (e.g., PGD), and the performance exceeds state-of-the-art proposals on these datasets.
updated: Wed Dec 01 2021 11:37:26 GMT+0000 (UTC)
published: Wed Dec 01 2021 11:37:26 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト