arXiv reaDer
潜在空間での敵対的攻撃の生成
Generating Adversarial Attacks in the Latent Space
入力 (ピクセル) 空間での敵対的攻撃は通常、L_1 や L_∞-norm などのノイズ マージンを組み込んで、ディープ ラーニング ネットワークを混乱させる知覚できない摂動データを生成します。このようなノイズ マージンによって、許容されるノイズの大きさが制限されます。この作業では、敵対的生成ネットワークを使用して潜在 (特徴) 空間に敵対的摂動を注入し、マージンベースの事前確率の必要性を排除することを提案します。 MNIST、CIFAR10、Fashion-MNIST、CIFAR100、Stanford Dogs データセットに関する実験は、ピクセルベースの敵対的攻撃方法に関して高度な視覚的リアリズムを確保しながら、潜在空間で敵対的攻撃を生成する提案された方法の有効性をサポートしています。
Adversarial attacks in the input (pixel) space typically incorporate noise margins such as L_1 or L_∞-norm to produce imperceptibly perturbed data that confound deep learning networks. Such noise margins confine the magnitude of permissible noise. In this work, we propose injecting adversarial perturbations in the latent (feature) space using a generative adversarial network, removing the need for margin-based priors. Experiments on MNIST, CIFAR10, Fashion-MNIST, CIFAR100 and Stanford Dogs datasets support the effectiveness of the proposed method in generating adversarial attacks in the latent space while ensuring a high degree of visual realism with respect to pixel-based adversarial attack methods.
updated: Mon Apr 10 2023 05:11:59 GMT+0000 (UTC)
published: Mon Apr 10 2023 05:11:59 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト