arXiv reaDer
一般化されたディープフェイク検出のための Real Face Foundation 表現学習
Real Face Foundation Representation Learning for Generalized Deepfake Detection
ディープフェイク技術の出現は、個人のプライバシーと公安に脅威を与えるため、社会的関心事となっています。現在、信頼できるディープフェイク検出器を開発することは非常に重要です。しかし、多数の顔操作アルゴリズムが存在するため、代表的な偽の顔を十分に収集することはほとんど不可能であり、既存の検出器がすべての種類の操作に一般化することは困難です。したがって、私たちは実際の顔の分布を学習し、実際の顔の分布から逸脱した偽の画像を間接的に識別します。この研究では、大規模な実際の顔のデータセットから一般的な表現を学習し、RFFR の分布外の潜在的なアーティファクトを検出することを目的とした Real Face Foundation Representation Learning (RFFR) を提案します。具体的には、マスク画像モデリング (MIM) によって実際の顔データセットでモデルをトレーニングします。これにより、モデルを偽のサンプルに適用すると、入力顔と再構築された顔との間に不一致が生じます。この不一致により、RFFR に含まれていない低レベルのアーティファクトが明らかになり、RFFR の分布外のあらゆる種類の潜在的なアーティファクトに敏感なディープフェイク検出器の構築が容易になります。広範な実験により、クロスマニピュレーション評価で最先端の方法を大幅に上回っており、RFFR をトレーニングするための余分な実際の顔を導入することでさらに改善される可能性があるため、私たちの方法はより優れた一般化パフォーマンスをもたらすことが示されています。
The emergence of deepfake technologies has become a matter of social concern as they pose threats to individual privacy and public security. It is now of great significance to develop reliable deepfake detectors. However, with numerous face manipulation algorithms present, it is almost impossible to collect sufficient representative fake faces, and it is hard for existing detectors to generalize to all types of manipulation. Therefore, we turn to learn the distribution of real faces, and indirectly identify fake images that deviate from the real face distribution. In this study, we propose Real Face Foundation Representation Learning (RFFR), which aims to learn a general representation from large-scale real face datasets and detect potential artifacts outside the distribution of RFFR. Specifically, we train a model on real face datasets by masked image modeling (MIM), which results in a discrepancy between input faces and the reconstructed ones when applying the model on fake samples. This discrepancy reveals the low-level artifacts not contained in RFFR, making it easier to build a deepfake detector sensitive to all kinds of potential artifacts outside the distribution of RFFR. Extensive experiments demonstrate that our method brings about better generalization performance, as it significantly outperforms the state-of-the-art methods in cross-manipulation evaluations, and has the potential to further improve by introducing extra real faces for training RFFR.
updated: Wed Mar 15 2023 08:27:56 GMT+0000 (UTC)
published: Wed Mar 15 2023 08:27:56 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト