Unauthorized AI cannot Recognize Me: Reversible Adversarial Example
この研究では、敵対的な例の特性を利用して、AIがユーザーのデータをどのように認識して使用するかを制御する新しい方法論を提案します。この目的のために、新しいタイプの敵対的例である可逆的敵対的例(RAE)を提案します。 RAEの注目すべき特徴は、許可されたAIが敵対的な摂動を排除することで、RAEから元の画像を正確に復元できるため、ユーザーが指定したAIモデルで画像を正しく認識して使用できることです。一方、他の無許可のAIモデルは、敵対的な例として機能するため、正しく認識できません。さらに、可逆性が復号化を保証するため、RAEはコンピュータビジョンに対する暗号化の一種と見なすことができます。 RAEを実現するために、敵対的な例、敵対的な摂動を正確に回復するための可逆データ隠蔽、および敵対的な摂動を除去できるAIの選択的制御のための暗号化の3つのテクノロジーを組み合わせます。実験結果は、提案された方法が、対応する敵対的攻撃方法と同等の攻撃能力と、ホワイトボックス攻撃とブラックボックス攻撃を含む元の画像と同様の視覚的品質を達成できることを示しています。
In this study, we propose a new methodology to control how user's data is recognized and used by AI via exploiting the properties of adversarial examples. For this purpose, we propose reversible adversarial example (RAE), a new type of adversarial example. A remarkable feature of RAE is that the image can be correctly recognized and used by the AI model specified by the user because the authorized AI can recover the original image from the RAE exactly by eliminating adversarial perturbation. On the other hand, other unauthorized AI models cannot recognize it correctly because it functions as an adversarial example. Moreover, RAE can be considered as one type of encryption to computer vision since reversibility guarantees the decryption. To realize RAE, we combine three technologies, adversarial example, reversible data hiding for exact recovery of adversarial perturbation, and encryption for selective control of AIs who can remove adversarial perturbation. Experimental results show that the proposed method can achieve comparable attack ability with the corresponding adversarial attack method and similar visual quality with the original image, including white-box attacks and black-box attacks.
updated: Fri Oct 08 2021 17:42:59 GMT+0000 (UTC)
published: Thu Nov 01 2018 02:28:31 GMT+0000 (UTC)
