ディープ生成モデルは最近、多くの現実のアプリケーションで印象的な結果を達成し、複雑なデータセットから高解像度で多様なサンプルを生成することに成功しました。この改善により、偽のデジタルコンテンツに対する関心が高まり、画像コンテンツに対する不信が広がり、AIが生成したこれらの偽画像を自動で検出する方法が急務となっています。多くの顔編集アルゴリズムは現実的な人間の顔を生成するように見えますが、綿密な検査で、特定のドメインにアーティファクトが見られます。この作業では、このような偽の顔画像を検出する簡単な方法、いわゆるDeepFakeを紹介します。私たちの方法は、基本的な分類器が続く古典的な周波数領域分析に基づいています。大量のラベル付きデータを供給する必要がある以前のシステムと比較して、我々のアプローチは、わずかな注釈付きトレーニングサンプルを使用するだけで非常に良い結果を示し、完全に教師なしのシナリオでも優れた精度を達成しました。高解像度の顔画像の評価のために、実際の顔と偽の顔のいくつかの公開データセットを組み合わせて、新しいベンチマークFaces-HQを作成しました。このような高解像度の画像が与えられた場合、わずか20個の注釈付きサンプルでトレーニングすると、このアプローチは100%の完全な分類精度に達します。 2番目の実験では、CelebAデータセットの中解像度画像の評価で、この方法は監視なしで100%の精度、監視なしで96%の精度を達成します。最後に、FaceForensics ++データセットの低解像度ビデオシーケンスを評価すると、操作されたビデオを91%の精度で検出できます。ソースコード:https://github.com/cc-hpc-itwm/DeepFakeDetection
Deep generative models have recently achieved impressive results for many real-world applications, successfully generating high-resolution and diverse samples from complex datasets. Due to this improvement, fake digital contents have proliferated growing concern and spreading distrust in image content, leading to an urgent need for automated ways to detect these AI-generated fake images. Despite the fact that many face editing algorithms seem to produce realistic human faces, upon closer examination, they do exhibit artifacts in certain domains which are often hidden to the naked eye. In this work, we present a simple way to detect such fake face images - so-called DeepFakes. Our method is based on a classical frequency domain analysis followed by basic classifier. Compared to previous systems, which need to be fed with large amounts of labeled data, our approach showed very good results using only a few annotated training samples and even achieved good accuracies in fully unsupervised scenarios. For the evaluation on high resolution face images, we combined several public datasets of real and fake faces into a new benchmark: Faces-HQ. Given such high-resolution images, our approach reaches a perfect classification accuracy of 100% when it is trained on as little as 20 annotated samples. In a second experiment, in the evaluation of the medium-resolution images of the CelebA dataset, our method achieves 100% accuracy supervised and 96% in an unsupervised setting. Finally, evaluating a low-resolution video sequences of the FaceForensics++ dataset, our method achieves 91% accuracy detecting manipulated videos. Source Code: https://github.com/cc-hpc-itwm/DeepFakeDetection