深い畳み込みニューラルネットワークは、複数の検出タスクで注目に値する結果を示しています。大きな進歩にもかかわらず、そのような検出器の性能は、非現実的な条件下で公開ベンチマークで評価されることがよくあります。具体的には、従来の歪みや圧縮、ノイズ、エンハンスメントなどの処理操作の影響は十分に研究されていません。このホワイトペーパーでは、より現実的な状況で学習ベースの検出器のパフォーマンスを評価するための厳密なフレームワークを提案します。実例は、ディープフェイク検出コンテキストの下に示されています。評価結果に触発されて、自然な画像劣化プロセスに基づくデータ拡張戦略が設計され、2つのディープフェイク検出器の一般化能力が大幅に向上します。
Deep convolutional neural networks have shown remarkable results on multiple detection tasks. Despite the significant progress, the performance of such detectors are often assessed in public benchmarks under non-realistic conditions. Specifically, impact of conventional distortions and processing operations such as compression, noise, and enhancement are not sufficiently studied. This paper proposes a rigorous framework to assess performance of learning-based detectors in more realistic situations. An illustrative example is shown under deepfake detection context. Inspired by the assessment results, a data augmentation strategy based on natural image degradation process is designed, which significantly improves the generalization ability of two deepfake detectors.