arXiv reaDer
マルチアテンションディープフェイク検出
Multi-attentional Deepfake Detection
ディープフェイクによる顔の偽造はインターネット上で広く普及しており、深刻な社会的懸念を引き起こしています。最近、このような偽造内容をどのように検出するかが注目されており、多くのディープフェイク検出方法が提案されています。それらのほとんどは、ディープフェイク検出をバニラバイナリ分類問題としてモデル化します。つまり、最初にバックボーンネットワークを使用してグローバル特徴を抽出し、次にそれをバイナリ分類器(本物/偽物)にフィードします。しかし、このタスクでの実際の画像と偽の画像の違いは微妙で局所的であることが多いため、このバニラソリューションは最適ではないと主張します。本論文では、代わりに、詳細な分類問題としてディープフェイク検出を定式化し、新しいマルチアテンションディープフェイク検出ネットワークを提案します。具体的には、次の3つの主要コンポーネントで構成されます。1)ネットワークをさまざまなローカル部分に参加させるための複数の空間アテンションヘッド。 2)浅い特徴の微妙なアーティファクトを拡大するためのテクスチャ特徴強化ブロック。 3)アテンションマップによって導かれる低レベルのテクスチャ機能と高レベルのセマンティック機能を集約します。さらに、このネットワークの学習障害に対処するために、新しい地域の独立性の喪失と注意誘導データ増強戦略をさらに導入します。さまざまなデータセットでの広範な実験を通じて、バニラ二項分類器の対応物に対する私たちの方法の優位性を実証し、最先端のパフォーマンスを実現します。
Face forgery by deepfake is widely spread over the internet and has raised severe societal concerns. Recently, how to detect such forgery contents has become a hot research topic and many deepfake detection methods have been proposed. Most of them model deepfake detection as a vanilla binary classification problem, i.e, first use a backbone network to extract a global feature and then feed it into a binary classifier (real/fake). But since the difference between the real and fake images in this task is often subtle and local, we argue this vanilla solution is not optimal. In this paper, we instead formulate deepfake detection as a fine-grained classification problem and propose a new multi-attentional deepfake detection network. Specifically, it consists of three key components: 1) multiple spatial attention heads to make the network attend to different local parts; 2) textural feature enhancement block to zoom in the subtle artifacts in shallow features; 3) aggregate the low-level textural feature and high-level semantic features guided by the attention maps. Moreover, to address the learning difficulty of this network, we further introduce a new regional independence loss and an attention guided data augmentation strategy. Through extensive experiments on different datasets, we demonstrate the superiority of our method over the vanilla binary classifier counterparts, and achieve state-of-the-art performance.
updated: Wed Mar 03 2021 13:56:14 GMT+0000 (UTC)
published: Wed Mar 03 2021 13:56:14 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト