arXiv reaDer
MMNet: 逐次ディープフェイク検出のためのマルチコラボレーションおよびマルチ監視ネットワーク
MMNet: Multi-Collaboration and Multi-Supervision Network for Sequential Deepfake Detection
高度な操作技術により、犯罪者は社会をパニックに陥らせたり、偽造された顔画像などの欺瞞的なメディアを生成して違法な利益を得る機会を得ることができました。これに応じて、画像の信頼性を評価するために、さまざまなディープフェイク検出方法が提案されています。ディープフェイク検出の拡張であるシーケンシャルディープフェイク検出は、正しいシーケンスで偽造された顔領域を特定して復元することを目的としています。それにもかかわらず、空間操作と逐次操作のさまざまな組み合わせにより、偽造された顔画像には大きな不一致が生じ、検出パフォーマンスに重大な影響を及ぼします。さらに、偽造画像の回復には、逆変換を実装するための操作モデルの知識が必要ですが、関連する技術が攻撃者によって隠蔽されていることが多いため、これを確認するのは困難です。これらの問題に対処するために、私たちは、偽造された顔画像のさまざまな空間スケールと逐次的置換を処理し、対応する操作方法の知識を必要とせずに回復を達成するマルチコラボレーションおよびマルチ監視ネットワーク(MMNet)を提案します。さらに、既存の評価指標は、単一の推論ステップでの検出精​​度のみを考慮しており、連続した複数のステップでのグラウンドトゥルースとの一致度は考慮されていません。この制限を克服するために、完全シーケンス マッチング (CSM) と呼ばれる新しい評価指標を提案します。これは、複数の推論ステップでの検出精​​度を考慮し、統合的に偽造されたシーケンスを検出する能力を反映しています。いくつかの典型的なデータセットに対する広範な実験により、MMNet が最先端の検出パフォーマンスと独立した回復パフォーマンスを達成していることが実証されています。
Advanced manipulation techniques have provided criminals with opportunities to make social panic or gain illicit profits through the generation of deceptive media, such as forged face images. In response, various deepfake detection methods have been proposed to assess image authenticity. Sequential deepfake detection, which is an extension of deepfake detection, aims to identify forged facial regions with the correct sequence for recovery. Nonetheless, due to the different combinations of spatial and sequential manipulations, forged face images exhibit substantial discrepancies that severely impact detection performance. Additionally, the recovery of forged images requires knowledge of the manipulation model to implement inverse transformations, which is difficult to ascertain as relevant techniques are often concealed by attackers. To address these issues, we propose Multi-Collaboration and Multi-Supervision Network (MMNet) that handles various spatial scales and sequential permutations in forged face images and achieve recovery without requiring knowledge of the corresponding manipulation method. Furthermore, existing evaluation metrics only consider detection accuracy at a single inferring step, without accounting for the matching degree with ground-truth under continuous multiple steps. To overcome this limitation, we propose a novel evaluation metric called Complete Sequence Matching (CSM), which considers the detection accuracy at multiple inferring steps, reflecting the ability to detect integrally forged sequences. Extensive experiments on several typical datasets demonstrate that MMNet achieves state-of-the-art detection performance and independent recovery performance.
updated: Thu Jul 06 2023 02:32:08 GMT+0000 (UTC)
published: Thu Jul 06 2023 02:32:08 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト