arXiv reaDer
堅牢な偽造検出のための自己監視による実際の会話の顔の活用
Leveraging Real Talking Faces via Self-Supervision for Robust Forgery Detection
顔を操作したビデオを検出するための最も差し迫った課題の1つは、圧縮などの一般的な破損の下で効果を維持しながら、トレーニング中には見られない偽造方法に一般化することです。この論文では、自然な顔の外観と行動に関する豊富な情報を含み、オンラインで大量に入手できる実際の話している顔のビデオを利用することによって、この問題に取り組むことができるかどうかを疑問視します。 RealForensicsと呼ばれる私たちの方法は、2つの段階で構成されています。まず、実際のビデオの視覚と聴覚のモダリティ間の自然な対応を利用して、自己監視型のクロスモーダルな方法で、顔の動き、表情、アイデンティティなどの要素をキャプチャする時間的に密なビデオ表現を学習します。次に、これらの学習された表現を、通常のバイナリ偽造分類タスクとともに偽造検出器によって予測されるターゲットとして使用します。これにより、上記の要因に基づいて本物/偽物の決定を下すことができます。私たちの方法がクロスマニピュレーションの一般化とロバストネス実験で最先端のパフォーマンスを達成することを示し、そのパフォーマンスに寄与する要因を調べます。私たちの結果は、自然でラベルのないビデオを活用することが、より堅牢な顔偽造検出器の開発のための有望な方向性であることを示唆しています。
One of the most pressing challenges for the detection of face-manipulated videos is generalising to forgery methods not seen during training while remaining effective under common corruptions such as compression. In this paper, we question whether we can tackle this issue by harnessing videos of real talking faces, which contain rich information on natural facial appearance and behaviour and are readily available in large quantities online. Our method, termed RealForensics, consists of two stages. First, we exploit the natural correspondence between the visual and auditory modalities in real videos to learn, in a self-supervised cross-modal manner, temporally dense video representations that capture factors such as facial movements, expression, and identity. Second, we use these learned representations as targets to be predicted by our forgery detector along with the usual binary forgery classification task; this encourages it to base its real/fake decision on said factors. We show that our method achieves state-of-the-art performance on cross-manipulation generalisation and robustness experiments, and examine the factors that contribute to its performance. Our results suggest that leveraging natural and unlabelled videos is a promising direction for the development of more robust face forgery detectors.
updated: Tue Jan 18 2022 17:14:54 GMT+0000 (UTC)
published: Tue Jan 18 2022 17:14:54 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト