深い畳み込みニューラルネットワークは、複数の検出および認識タスクで並外れた結果を達成しました。ただし、このような検出器のパフォーマンスは、制約のある非現実的な状況下で公開ベンチマークで評価されることがよくあります。圧縮、ノイズ、エンハンスメントなどのイメージングワークフローに見られる従来の歪みと処理操作の影響は十分に研究されていません。現在、目に見えない摂動に対する検出器のロバスト性を改善するために行われた研究はほんのわずかです。この論文は、実世界の画像劣化プロセスに基づくより効果的なデータ拡張スキームを提案します。この新しい手法は、ディープフェイク検出タスクに展開され、より現実的な評価フレームワークによって評価されています。広範な実験により、提案されたデータ拡張スキームにより、予測できないデータの歪みや見えないデータセットに対する一般化能力が向上することが示されています。
Deep convolutional neural networks have achieved exceptional results on multiple detection and recognition tasks. However, the performance of such detectors are often evaluated in public benchmarks under constrained and non-realistic situations. The impact of conventional distortions and processing operations found in imaging workflows such as compression, noise, and enhancement are not sufficiently studied. Currently, only a few researches have been done to improve the detector robustness to unseen perturbations. This paper proposes a more effective data augmentation scheme based on real-world image degradation process. This novel technique is deployed for deepfake detection tasks and has been evaluated by a more realistic assessment framework. Extensive experiments show that the proposed data augmentation scheme improves generalization ability to unpredictable data distortions and unseen datasets.