ディープフェイクは、誰でも1つのビデオで2つのIDを交換できる、最近の既成の操作手法です。 Deepfakesに加えて、さまざまなGANベースのフェイススワッピング方法もコードとともに公開されています。この新たな脅威に対抗するために、検出モデルのトレーニングを可能にする非常に大きなフェイススワップビデオデータセットを構築し、それに伴うDeepFake Detection Challenge(DFDC)Kaggleコンテストを開催しました。重要なことに、記録されたすべての被験者は、顔を入れ替えたデータセットの構築中に参加し、肖像を変更することに同意しました。 DFDCデータセットは、現在公開されているフェイススワップビデオデータセットとしては群を抜いて最大であり、ディープフェイク、GANベース、および未学習のいくつかの方法で作成された3,426人の有料俳優からの合計100,000を超えるクリップがあります。データセットの構築に使用される方法を説明することに加えて、Kaggleコンテストからの上位の提出物の詳細な分析を提供します。ディープフェイクの検出は非常に困難であり、未解決の問題ですが、DFDCでのみトレーニングされたディープフェイク検出モデルは実際の「野生の」ディープフェイクビデオに一般化でき、そのようなモデルは潜在的に分析する際の貴重な分析ツールになります。ディープフェイク動画。コーパスのトレーニング、検証、テストはhttps://ai.facebook.com/datasets/dfdcからダウンロードできます。
Deepfakes are a recent off-the-shelf manipulation technique that allows anyone to swap two identities in a single video. In addition to Deepfakes, a variety of GAN-based face swapping methods have also been published with accompanying code. To counter this emerging threat, we have constructed an extremely large face swap video dataset to enable the training of detection models, and organized the accompanying DeepFake Detection Challenge (DFDC) Kaggle competition. Importantly, all recorded subjects agreed to participate in and have their likenesses modified during the construction of the face-swapped dataset. The DFDC dataset is by far the largest currently and publicly available face swap video dataset, with over 100,000 total clips sourced from 3,426 paid actors, produced with several Deepfake, GAN-based, and non-learned methods. In addition to describing the methods used to construct the dataset, we provide a detailed analysis of the top submissions from the Kaggle contest. We show although Deepfake detection is extremely difficult and still an unsolved problem, a Deepfake detection model trained only on the DFDC can generalize to real "in-the-wild" Deepfake videos, and such a model can be a valuable analysis tool when analyzing potentially Deepfaked videos. Training, validation and testing corpuses can be downloaded from https://ai.facebook.com/datasets/dfdc.