arXiv reaDer
Localized Adversarial Training for Increased Accuracy and Robustness in Image Classification
  今日の最先端の画像分類器は、慎重に操作された敵対的な画像を正しく分類できません。この作業では、通常の画像の背景を感知できないように変更することにより、敵の例を生成する新しいローカライズされた敵の攻撃を開発します。最初にこの攻撃を使用して、画像の背景の変化に対するニューラルネットワークの不必要な感度を強調し、次に新しいトレーニング手法の一部として使用します:ローカライズされた敵対的トレーニング。トレーニングセットにローカルの敵対画像を含めることにより、自然入力と敵対入力の両方で、非敵対的にトレーニングされた対応モデルよりも損失の少ない分類子を作成できます。 MNISTおよびCIFAR-10データセットでのローカライズされた敵対者トレーニングアルゴリズムの評価は、自然画像の精度低下の減少、および敵対者入力に対する堅牢性の向上を示しています。
Today's state-of-the-art image classifiers fail to correctly classify carefully manipulated adversarial images. In this work, we develop a new, localized adversarial attack that generates adversarial examples by imperceptibly altering the backgrounds of normal images. We first use this attack to highlight the unnecessary sensitivity of neural networks to changes in the background of an image, then use it as part of a new training technique: localized adversarial training. By including locally adversarial images in the training set, we are able to create a classifier that suffers less loss than a non-adversarially trained counterpart model on both natural and adversarial inputs. The evaluation of our localized adversarial training algorithm on MNIST and CIFAR-10 datasets shows decreased accuracy loss on natural images, and increased robustness against adversarial inputs.
updated: Tue Sep 10 2019 22:26:48 GMT+0000 (UTC)
published: Tue Sep 10 2019 22:26:48 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト