過去数年間のディープ生成モデルの急速な進歩により、ディープフェイクと呼ばれる非常にリアルなメディアが生まれました。これは、通常、実際の目と人間の目で見分けがつかないほどです。これらの進歩により、ビジュアル データの信頼性を評価することがますます困難になり、一般的なビジュアル コンテンツの信頼性に誤報の脅威がもたらされます。最近の研究では、このようなディープフェイクの強力な検出精度が示されていますが、成功は生成された画像内の周波数アーティファクトの特定に大きく依存しています.生成モデルは進化を続け、実際の画像とのギャップを埋めているため、持続可能な検出アプローチは得られません。この問題を克服するために、テスト画像を再合成し、検出のための視覚的手がかりを抽出するように設計された新しい偽の検出を提案します。再合成手順は柔軟であるため、一連の視覚的タスクを組み込むことができます。再合成として、超解像、ノイズ除去、カラー化を採用します。 CelebA-HQ、FFHQ、および LSUN データセット上の複数のジェネレーターを含むさまざまな検出シナリオで、アプローチの摂動に対する改善された有効性、クロスGAN一般化、および堅牢性を示しています。ソースコードは https://github.com/SSAW14/BeyondtheSpectrum で入手できます。
The rapid advances in deep generative models over the past years have led to highly realistic media, known as deepfakes, that are commonly indistinguishable from real to human eyes. These advances make assessing the authenticity of visual data increasingly difficult and pose a misinformation threat to the trustworthiness of visual content in general. Although recent work has shown strong detection accuracy of such deepfakes, the success largely relies on identifying frequency artifacts in the generated images, which will not yield a sustainable detection approach as generative models continue evolving and closing the gap to real images. In order to overcome this issue, we propose a novel fake detection that is designed to re-synthesize testing images and extract visual cues for detection. The re-synthesis procedure is flexible, allowing us to incorporate a series of visual tasks - we adopt super-resolution, denoising and colorization as the re-synthesis. We demonstrate the improved effectiveness, cross-GAN generalization, and robustness against perturbations of our approach in a variety of detection scenarios involving multiple generators over CelebA-HQ, FFHQ, and LSUN datasets. Source code is available at https://github.com/SSAW14/BeyondtheSpectrum.