最近、Generative Adversarial Networks(GAN)と画像操作方法はより強力になり、デジタルメディアの信頼性に関して大きな懸念を引き起こしている人間の認識を超えた非常に現実的な顔画像を生成できます。顔の法医学的分類の問題に取り組む先行研究がいくつかありましたが、分類予測から編集された場所を推定することは簡単ではありません。この論文では、私たちの知る限り、真の、生成され、操作された顔画像で構成される最初の厳密な顔科学捜査データセットを提案します。特に、元の部分にはCelebAおよびFFHQデータセットからの顔画像が含まれています。偽の画像は、DCGAN、LSGAN、BEGAN、WGAN-GP、ProGAN、StyleGANなどのさまざまなGANメソッドから生成されます。最後に、編集されたサブセットは、フリーフォームマスクに基づいてStarGANおよびSEFCGANから生成されます。合計で、データセットには、対応するバイナリマスクでラベル付けされた約130万の顔画像が含まれています。提案されたデータセットに基づいて、入力画像に加えて顔のランドマーク情報を明示的に追加するとパフォーマンスが向上することを実証しました。さらに、提案された方法は2つのブランチで構成されており、顔の法医学的検出とローカリゼーションをコヒーレントに予測して、特に低品質のビデオのfaceforecsic ++データセットだけでなく、新しく提案されたデータセットで以前の最先端の技術を上回ることができます。
Recently, Generative Adversarial Networks (GANs) and image manipulating methods are becoming more powerful and can produce highly realistic face images beyond human recognition which have raised significant concerns regarding the authenticity of digital media. Although there have been some prior works that tackle face forensic classification problem, it is not trivial to estimate edited locations from classification predictions. In this paper, we propose, to the best of our knowledge, the first rigorous face forensic localization dataset, which consists of genuine, generated, and manipulated face images. In particular, the pristine parts contain face images from CelebA and FFHQ datasets. The fake images are generated from various GANs methods, namely DCGANs, LSGANs, BEGANs, WGAN-GP, ProGANs, and StyleGANs. Lastly, the edited subset is generated from StarGAN and SEFCGAN based on free-form masks. In total, the dataset contains about 1.3 million facial images labelled with corresponding binary masks. Based on the proposed dataset, we demonstrated that explicit adding facial landmarks information in addition to input images improves the performance. In addition, our proposed method consists of two branches and can coherently predict face forensic detection and localization to outperform the previous state-of-the-art techniques on the newly proposed dataset as well as the faceforecsic++ dataset especially on low-quality videos.