arXiv reaDer
L_2の敵対的な例の感度を悪用して消去および復元する
Exploiting the Sensitivity of L_2 Adversarial Examples to Erase-and-Restore
慎重に作成された摂動を入力画像に追加することにより、敵対的な例(AE)を生成して、ニューラルネットワークベースの画像分類器を誤解させる可能性があります。 CarliniとWagner(CW)によるL_2の敵対的摂動は、最も効果的ですが検出が難しい攻撃の1つです。 AEに対する多くの対策が提案されていますが、適応型CW-L_2AEの検出は未解決の問題です。 L_2 AEの一部のピクセルをランダムに消去し、修復手法で復元すると、ステップの前後でAEの分類結果が異なる傾向がありますが、良性のサンプルではこの症状は見られません。したがって、L_2攻撃の興味深い感度を利用する、新しいAE検出手法であるErase-and-Restore(E&R)を提案します。 2つの人気のある画像データセットCIFAR-10とImageNetで実施された実験は、提案された手法がL_2 AEの98%以上を検出でき、良性画像での偽陽性率が非常に低いことを示しています。検出技術は高い転送可能性を示します。CW-L_2AEを使用してトレーニングされた検出システムは、別のL_2攻撃方法を使用して生成されたAEを正確に検出できます。さらに重要なことに、私たちのアプローチは、適応型L_2攻撃に対する強力な回復力を示し、AE検出の重大なギャップを埋めます。最後に、視覚化と定量化の両方を通じて検出手法を解釈します。
By adding carefully crafted perturbations to input images, adversarial examples (AEs) can be generated to mislead neural-network-based image classifiers. L_2 adversarial perturbations by Carlini and Wagner (CW) are among the most effective but difficult-to-detect attacks. While many countermeasures against AEs have been proposed, detection of adaptive CW-L_2 AEs is still an open question. We find that, by randomly erasing some pixels in an L_2 AE and then restoring it with an inpainting technique, the AE, before and after the steps, tends to have different classification results, while a benign sample does not show this symptom. We thus propose a novel AE detection technique, Erase-and-Restore (E&R), that exploits the intriguing sensitivity of L_2 attacks. Experiments conducted on two popular image datasets, CIFAR-10 and ImageNet, show that the proposed technique is able to detect over 98% of L_2 AEs and has a very low false positive rate on benign images. The detection technique exhibits high transferability: a detection system trained using CW-L_2 AEs can accurately detect AEs generated using another L_2 attack method. More importantly, our approach demonstrates strong resilience to adaptive L_2 attacks, filling a critical gap in AE detection. Finally, we interpret the detection technique through both visualization and quantification.
updated: Sat Dec 12 2020 23:48:02 GMT+0000 (UTC)
published: Wed Jan 01 2020 00:15:07 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト