ディープニューラルネットワーク(DNN)は、デジタルフォレンジックで偽の顔の画像を識別するために使用されています。いくつかのDNNベースの偽造フォレンジックモデル(FFM)を調査し、それらが敵対的な攻撃に対して安全かどうかを調べました。私たちは、適切に実行されたFFMを誤動作させる可能性のある、個々の敵対的摂動(IAP)と普遍的な敵対的摂動(UAP)の存在を実験的に実証しました。反復手順に基づいて、勾配情報を使用して、分類とセグメンテーションの出力の作成に使用できる2種類のIAPを生成します。対照的に、UAPはオーバーファイアに基づいて生成されます。ニューロンのオーバーファイアを促進する新しい目的関数を設計しました。これにより、トレーニングデータを使用しなくてもUAPの生成が可能になります。実験により、目に見えないデータセットと目に見えないFFM間でのUAPの転送可能性が実証されました。さらに、細工されたUAPが視覚的に無視できることを明らかにして、敵対的な摂動の知覚不能性について主観的な評価を行いました。これらの調査結果は、FFMの敵対的なセキュリティを評価するためのベースラインを提供します。
Deep neural networks (DNNs) have been used in digital forensics to identify fake facial images. We investigated several DNN-based forgery forensics models (FFMs) to examine whether they are secure against adversarial attacks. We experimentally demonstrated the existence of individual adversarial perturbations (IAPs) and universal adversarial perturbations (UAPs) that can lead a well-performed FFM to misbehave. Based on iterative procedure, gradient information is used to generate two kinds of IAPs that can be used to fabricate classification and segmentation outputs. In contrast, UAPs are generated on the basis of over-firing. We designed a new objective function that encourages neurons to over-fire, which makes UAP generation feasible even without using training data. Experiments demonstrated the transferability of UAPs across unseen datasets and unseen FFMs. Moreover, we conducted subjective assessment for imperceptibility of the adversarial perturbations, revealing that the crafted UAPs are visually negligible. These findings provide a baseline for evaluating the adversarial security of FFMs.