Mixup Inference: Better Exploiting Mixup to Defend Adversarial Attacks
 敵対的な例は、深いネットワークを欺くために簡単に作成できることは広く認識されています。トレーニングにミックスアップを適用すると、一般化パフォーマンスを改善し、敵対的摂動に対するモデルの堅牢性を向上させる効果的なメカニズムが提供されます。これにより、トレーニング例の間にグローバルな線形動作が導入されます。ただし、以前の研究では、ミックスアップトレーニングモデルは、誘導されたグローバルな線形性が十分に活用されていない入力を直接分類することにより、推論における敵対的攻撃を受動的に防御するだけでした。つまり、敵対的摂動の局所性から、モデル予測のグローバル性を介して局所性を積極的に破ることがより効率的です。単純な幾何学的直観に着想を得て、ミックスアップトレーニングモデルのミックスアップ推論(MI)と呼ばれる推論原理を開発します。 MIは、入力を他のランダムなクリーンサンプルとミックスアップします。これは、入力が敵対的である場合、同等の摂動を縮小および伝達できます。 CIFAR-10およびCIFAR-100での実験は、MIが、混乱とそのバリアントによってトレーニングされたモデルの敵対的堅牢性をさらに改善できることを示しています。
It has been widely recognized that adversarial examples can be easily crafted to fool deep networks, which mainly root from the locally non-linear behavior nearby input examples. Applying mixup in training provides an effective mechanism to improve generalization performance and model robustness against adversarial perturbations, which introduces the globally linear behavior in-between training examples. However, in previous work, the mixup-trained models only passively defend adversarial attacks in inference by directly classifying the inputs, where the induced global linearity is not well exploited. Namely, since the locality of the adversarial perturbations, it would be more efficient to actively break the locality via the globality of the model predictions. Inspired by simple geometric intuition, we develop an inference principle, named mixup inference (MI), for mixup-trained models. MI mixups the input with other random clean samples, which can shrink and transfer the equivalent perturbation if the input is adversarial. Our experiments on CIFAR-10 and CIFAR-100 demonstrate that MI can further improve the adversarial robustness for the models trained by mixup and its variants.
updated: Thu Feb 20 2020 08:54:57 GMT+0000 (UTC)
published: Wed Sep 25 2019 14:21:55 GMT+0000 (UTC)
