arXiv reaDer
真の顔の自己摂動のみを使用した敵対者の顔の検出
Detecting Adversarial Faces Using Only Real Face Self-Perturbations
敵対的攻撃は、入力サンプルに特定のノイズを追加することでターゲット システムの機能を妨害することを目的としており、顔認識システムに適用するとセキュリティと堅牢性に潜在的な脅威をもたらします。既存の防御技術は、特定の敵対者の顔 (adv-face) を検出する際に高い精度を実現しますが、新しい攻撃方法、特にノイズ パターンがまったく異なる GAN ベースの攻撃はそれらを回避し、より高い攻撃成功率を達成します。さらに悪いことに、既存の技術は防御を実装する前に攻撃データを必要とするため、防御側が認識できない新たに出現した攻撃を防御することは現実的ではありません。この論文では、アドフェイスの本質的な一般性を調査し、ヒューリスティックに設計された3つのノイズパターンで実際の顔を摂動することにより、疑似アドフェイスを生成することを提案します。私たちは、被害者の顔認識システムにとらわれず、目に見えない攻撃にとらわれず、実際の顔とその自己摂動のみを使用して adv-face 検出器をトレーニングした最初の企業です。 adv-faces を分布外データと見なすことで、adv-face 検出のための新しいカスケード システムを自然に導入します。これは、トレーニング データの自己摂動、決定境界の正則化、および最大プーリング ベースのバイナリ分類器のフォーカスで構成されます。異常な局所色収差について。 8 つの勾配ベースの攻撃と 2 つの GAN ベースの攻撃を使用して LFW および CelebA-HQ データセットに対して実施された実験では、私たちの方法がさまざまな目に見えない敵対的攻撃に一般化されることが検証されました。
Adversarial attacks aim to disturb the functionality of a target system by adding specific noise to the input samples, bringing potential threats to security and robustness when applied to facial recognition systems. Although existing defense techniques achieve high accuracy in detecting some specific adversarial faces (adv-faces), new attack methods especially GAN-based attacks with completely different noise patterns circumvent them and reach a higher attack success rate. Even worse, existing techniques require attack data before implementing the defense, making it impractical to defend newly emerging attacks that are unseen to defenders. In this paper, we investigate the intrinsic generality of adv-faces and propose to generate pseudo adv-faces by perturbing real faces with three heuristically designed noise patterns. We are the first to train an adv-face detector using only real faces and their self-perturbations, agnostic to victim facial recognition systems, and agnostic to unseen attacks. By regarding adv-faces as out-of-distribution data, we then naturally introduce a novel cascaded system for adv-face detection, which consists of training data self-perturbations, decision boundary regularization, and a max-pooling-based binary classifier focusing on abnormal local color aberrations. Experiments conducted on LFW and CelebA-HQ datasets with eight gradient-based and two GAN-based attacks validate that our method generalizes to a variety of unseen adversarial attacks.
updated: Thu May 04 2023 01:40:39 GMT+0000 (UTC)
published: Sat Apr 22 2023 09:55:48 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト