arXiv reaDer
ゲートバッチ正規化による複数の ℓ_p-norm 境界付き敵対的摂動の防御に向けて
Towards Defending Multiple ℓ_p-norm Bounded Adversarial Perturbations via Gated Batch Normalization
ディープ ニューラル ネットワークが敵対的な例に対して脆弱であることを示す広範な証拠があり、これが敵対的な攻撃に対する防御の開発の動機となっています。既存の敵対的防御は、通常、個々の特定の摂動タイプ (例、ℓ_∞ ノルム境界の敵対的例) に対するモデルの堅牢性を向上させます。ただし、実際には、敵対者は複数のタイプの摂動 (たとえば、ℓ_1、ℓ_2、および ℓ_∞ の摂動) を生成する可能性があります。いくつかの最近の手法は、複数の ℓ_p ボールにおける敵対的攻撃に対するモデルの堅牢性を向上させていますが、各摂動タイプに対するパフォーマンスはまだ満足のいくものとは程遠いです。この論文では、異なる ℓ_p 有界敵対的摂動が、バッチ正規化 (BN) の統計によって分離および特徴付けることができる異なる統計的特性を誘発することを観察します。したがって、複数の ℓ_p 境界のある敵対的摂動を防御するために、摂動不変予測子を敵対的にトレーニングするためのゲート バッチ正規化 (GBN) を提案します。 GBN は、マルチブランチ BN 層とゲート サブネットワークで構成されます。 GBN の各 BN ブランチは 1 つの摂動タイプを担当し、正規化された出力が摂動不変表現の学習に向けて確実に調整されるようにします。一方、ゲートされたサブネットワークは、さまざまな種類の摂動が追加された入力を分離するように設計されています。私たちは、MNIST、CIFAR-10、Tiny-ImageNet などの一般的に使用されるデータセットに対してアプローチの広範な評価を実行し、GBN が複数の摂動タイプ (つまり、ℓ_1、ℓ_2、および ℓ_∞ 摂動) に対して以前の防御提案よりも優れていることを実証します。大きなマージン。
There has been extensive evidence demonstrating that deep neural networks are vulnerable to adversarial examples, which motivates the development of defenses against adversarial attacks. Existing adversarial defenses typically improve model robustness against individual specific perturbation types (e.g. , ℓ_∞-norm bounded adversarial examples). However, adversaries are likely to generate multiple types of perturbations in practice (e.g. , ℓ_1, ℓ_2, and ℓ_∞ perturbations). Some recent methods improve model robustness against adversarial attacks in multiple ℓ_p balls, but their performance against each perturbation type is still far from satisfactory. In this paper, we observe that different ℓ_p bounded adversarial perturbations induce different statistical properties that can be separated and characterized by the statistics of Batch Normalization (BN). We thus propose Gated Batch Normalization (GBN) to adversarially train a perturbation-invariant predictor for defending multiple ℓ_p bounded adversarial perturbations. GBN consists of a multi-branch BN layer and a gated sub-network. Each BN branch in GBN is in charge of one perturbation type to ensure that the normalized output is aligned towards learning perturbation-invariant representation. Meanwhile, the gated sub-network is designed to separate inputs added with different perturbation types. We perform an extensive evaluation of our approach on commonly-used dataset including MNIST, CIFAR-10, and Tiny-ImageNet, and demonstrate that GBN outperforms previous defense proposals against multiple perturbation types (i.e. , ℓ_1, ℓ_2, and ℓ_∞ perturbations) by large margins.
updated: Fri Aug 11 2023 12:57:04 GMT+0000 (UTC)
published: Thu Dec 03 2020 02:26:01 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト