畳み込みニューラルネットワークは、近年、一連の成功を収めるために使用されてきましたが、その解釈性の欠如は依然として深刻な問題です。敵対的な例は、ニューラルネットワークを意図的にだまして、希望する不正な分類を作成するように設計されています。いくつかの防御的アプローチは、目に見えるアーティファクトにつながる、より大きな攻撃を要求する敵対的な攻撃に対する堅牢性を高めます。人間の視覚認識を考慮することにより、複雑な領域でこのような敵対的な攻撃を隠蔽して、鋭い観察者にも知覚できないようにする手法を構成します。私たちは、私たちのアプローチの知覚品質を検証し、人間の視覚認識に関してその隠蔽の重要な証拠を見つけるために、敵対的に変更された画像の分類に関するユーザー調査を実施します。
Convolutional neural networks have been used to achieve a string of successes during recent years, but their lack of interpretability remains a serious issue. Adversarial examples are designed to deliberately fool neural networks into making any desired incorrect classification, potentially with very high certainty. Several defensive approaches increase robustness against adversarial attacks, demanding attacks of greater magnitude, which lead to visible artifacts. By considering human visual perception, we compose a technique that allows to hide such adversarial attacks in regions of high complexity, such that they are imperceptible even to an astute observer. We carry out a user study on classifying adversarially modified images to validate the perceptual quality of our approach and find significant evidence for its concealment with regards to human visual perception.