arXiv reaDer
Learning to Generate Noise for Multi-Attack Robustness
敵対的学習は、敵対的摂動に対する既存の方法の感受性を回避するための成功した手法の 1 つとして浮上しています。ただし、既存の防御方法の大部分は、単一のカテゴリの敵対的摂動 (たとえば、ℓ_∞-攻撃) に対して防御するように調整されています。安全性が重要なアプリケーションでは、攻撃者がさまざまな敵を採用してシステムを欺くことができるため、これらの方法は無関係になります。さらに、複数の摂動で同時にトレーニングすると、トレーニング中の計算オーバーヘッドが大幅に増加します。これらの課題に対処するために、ノイズの生成を明示的に学習して、複数のタイプの攻撃に対するモデルの堅牢性を向上させる、新しいメタ学習フレームワークを提案します。その主要なコンポーネントはメタ ノイズ ジェネレーター (MNG) であり、最適なノイズを出力して特定のサンプルを確率的に摂動させ、さまざまな敵対的摂動でのエラーを低減するのに役立ちます。 MNG によって生成されたサンプルを利用することで、複数の摂動にわたってラベルの一貫性を強制することでモデルをトレーニングします。さまざまなデータセットでさまざまな摂動に対してスキームによってトレーニングされたモデルの堅牢性を検証し、限界の計算コストで複数の摂動にわたってベースラインを大幅に上回ることを示しています。
Adversarial learning has emerged as one of the successful techniques to circumvent the susceptibility of existing methods against adversarial perturbations. However, the majority of existing defense methods are tailored to defend against a single category of adversarial perturbation (e.g. ℓ_∞-attack). In safety-critical applications, this makes these methods extraneous as the attacker can adopt diverse adversaries to deceive the system. Moreover, training on multiple perturbations simultaneously significantly increases the computational overhead during training. To address these challenges, we propose a novel meta-learning framework that explicitly learns to generate noise to improve the model's robustness against multiple types of attacks. Its key component is Meta Noise Generator (MNG) that outputs optimal noise to stochastically perturb a given sample, such that it helps lower the error on diverse adversarial perturbations. By utilizing samples generated by MNG, we train a model by enforcing the label consistency across multiple perturbations. We validate the robustness of models trained by our scheme on various datasets and against a wide variety of perturbations, demonstrating that it significantly outperforms the baselines across multiple perturbations with a marginal computational cost.
updated: Wed Jun 09 2021 17:36:33 GMT+0000 (UTC)
published: Mon Jun 22 2020 10:44:05 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト