arXiv reaDer
対照的多面フォレンジック: 多面偽造検出のためのエンドツーエンドの二粒度対照学習アプローチ
Contrastive Multi-FaceForensics: An End-to-end Bi-grained Contrastive Learning Approach for Multi-face Forgery Detection
ディープフェイクは深刻な社会的懸念を引き起こし、近年、検出ベースのフォレンジック手法が大幅に増加しています。顔偽造認識は、通常 2 段階のパイプラインに従う従来の検出方法です。最初に顔を抽出し、次に分類によってその真偽を判断します。世に出回っているディープフェイクには通常複数の顔が含まれているため、後続で顔を処理する必要がある、つまり同時に処理される顔は 1 つだけであるため、顔偽造検出方法を使用することは実用的です。この問題に対処する簡単な方法の 1 つは、高度な物体検出アーキテクチャを適応させて、顔抽出と偽造検出をエンドツーエンド方式で統合することです。ただし、これらの物体検出アーキテクチャは、顔間の微妙な偽造痕跡ではなく、さまざまな物体カテゴリの意味情報を捕捉するように設計されているため、直接の適応は最適とは程遠いです。この論文では、複数顔の偽造検出を強化するための新しいエンドツーエンド フレームワークである Contrastive Multi-FaceForensics (COMICS) について説明します。提案されたフレームワークの中核は、粗粒レベルと細粒レベルの両方で効果的な顔偽造の痕跡を探索する、新しい二粒度の対照学習アプローチです。具体的には、粗視化レベルの対比学習は、提案ジェネレータの指示により、複数のスケールでポジティブとネガティブの提案ペア間の識別特徴を捕捉し、細粒化レベルの対比学習は、偽造領域とオリジナル領域間のピクセルごとの差異を捕捉します。同じ顔の場合と、異なる顔間のピクセル単位のコンテンツの不一致。 OpenForensics データセットに対する広範な実験により、私たちの手法が他の対応する手法よりも大幅に (~18.5%) 優れたパフォーマンスを示し、さまざまなアーキテクチャに統合できる大きな可能性が示されています。
DeepFakes have raised serious societal concerns, leading to a great surge in detection-based forensics methods in recent years. Face forgery recognition is the conventional detection method that usually follows a two-phase pipeline: it extracts the face first and then determines its authenticity by classification. Since DeepFakes in the wild usually contain multiple faces, using face forgery detection methods is merely practical as they have to process faces in a sequel, i.e., only one face is processed at the same time. One straightforward way to address this issue is to integrate face extraction and forgery detection in an end-to-end fashion by adapting advanced object detection architectures. However, as these object detection architectures are designed to capture the semantic information of different object categories rather than the subtle forgery traces among the faces, the direct adaptation is far from optimal. In this paper, we describe a new end-to-end framework, Contrastive Multi-FaceForensics (COMICS), to enhance multi-face forgery detection. The core of the proposed framework is a novel bi-grained contrastive learning approach that explores effective face forgery traces at both the coarse- and fine-grained levels. Specifically, the coarse-grained level contrastive learning captures the discriminative features among positive and negative proposal pairs in multiple scales with the instruction of the proposal generator, and the fine-grained level contrastive learning captures the pixel-wise discrepancy between the forged and original areas of the same face and the pixel-wise content inconsistency between different faces. Extensive experiments on the OpenForensics dataset demonstrate our method outperforms other counterparts by a large margin (~18.5%) and shows great potential for integration into various architectures.
updated: Thu Aug 03 2023 03:37:13 GMT+0000 (UTC)
published: Thu Aug 03 2023 03:37:13 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト