ディープ ニューラル ネットワークは、敵対的なイメージに対して脆弱であることが示されています。従来の攻撃は、摂動が厳密に制限された、見分けがつかない敵対的なイメージを狙っています。最近、研究者は、識別可能であるが疑わしくない敵対的な画像を調査するようになり、色変換攻撃が効果的であることを実証しました。この作業では、Adversarial Color Filter (AdvCF) を提案します。Adversarial Color Filter (AdvCF) は、単純なカラー フィルターのパラメーター空間でグラデーション情報を使用して最適化される新しい色変換攻撃です。特に、攻撃と防御の両方の観点から、敵対的な色変換に対するモデルの堅牢性の体系的な分析を提供できるように、カラー フィルター空間が明示的に指定されています。対照的に、既存の色変換攻撃は、そのような明示的なスペースがないため、体系的な分析の機会を提供しません。さらに、ユーザー調査を通じて、成功率と画像の受容性の両方について、さまざまな色変換攻撃間の広範な比較を行います。追加の結果は、別の 3 つの視覚的タスクにおける AdvCF に対するモデルの堅牢性に関する興味深い新しい洞察を提供します。また、実用的なシナリオで有望なAdvCFの人間による解釈可能性を強調し、画像の許容性と効率の両方で、最先端の人間による解釈可能な色変換攻撃よりも優れていることを示します。
Deep Neural Networks have been shown to be vulnerable to adversarial images. Conventional attacks strive for indistinguishable adversarial images with strictly restricted perturbations. Recently, researchers have moved to explore distinguishable yet non-suspicious adversarial images and demonstrated that color transformation attacks are effective. In this work, we propose Adversarial Color Filter (AdvCF), a novel color transformation attack that is optimized with gradient information in the parameter space of a simple color filter. In particular, our color filter space is explicitly specified so that we are able to provide a systematic analysis of model robustness against adversarial color transformations, from both the attack and defense perspectives. In contrast, existing color transformation attacks do not offer the opportunity for systematic analysis due to the lack of such an explicit space. We further conduct extensive comparisons between different color transformation attacks on both the success rate and image acceptability, through a user study. Additional results provide interesting new insights into model robustness against AdvCF in another three visual tasks. We also highlight the human-interpretability of AdvCF, which is promising in practical use scenarios, and show its superiority over the state-of-the-art human-interpretable color transformation attack on both the image acceptability and efficiency.