arXiv reaDer
MorphGANFormer: Transformer ベースの顔のモーフィングとデモーフィング
MorphGANFormer: Transformer-based Face Morphing and De-Morphing
セマンティックな顔画像操作は、近年注目を集めています。顔のモーフィングに対する StyleGAN ベースのアプローチは、主要な手法の 1 つです。ただし、潜在的な特徴空間での均一な注意の結果として、顕著なぼやけやアーティファクトに悩まされることがよくあります。この論文では、顔のモーフィングに代わるトランスフォーマーベースの代替手段を開発し、StyleGANベースの方法に対するその優位性を実証することを提案します。私たちの貢献は3倍です。まず、GANformer に着想を得て、潜在変数から顕著な顔の特徴への情報の反復伝播のために、顔画像の長距離相互作用を利用するための二部構造を導入します。顔モーフィングの最適化をサポートするために、特別な損失関数が設計されています。次に、MorphGANFormer の同じジェネレーターを使用して参照画像にアクセスする効果的な防御戦略を提示することにより、トランスフォーマーベースの顔モーフィングの研究をデモーフィングに拡張します。このようなデモーフィングは、概念的にはハイパースペクトル イメージのアンミキシングに似ていますが、潜在的な (ピクセルではなく) 空間で動作します。第三に、初めて、顔モーフィング研究の脆弱性と検出性のトレードオフの基本的な問題に対処します。ドッペルゲンガーもランダムペアの選択も最適ではなく、ラグランジュ乗数ベースのアプローチを使用して、認識の脆弱性と攻撃の検出可能性の間のトレードオフを改善する必要があると主張されています。
Semantic face image manipulation has received increasing attention in recent years. StyleGAN-based approaches to face morphing are among the leading techniques; however, they often suffer from noticeable blurring and artifacts as a result of the uniform attention in the latent feature space. In this paper, we propose to develop a transformer-based alternative to face morphing and demonstrate its superiority to StyleGAN-based methods. Our contributions are threefold. First, inspired by GANformer, we introduce a bipartite structure to exploit long-range interactions in face images for iterative propagation of information from latent variables to salient facial features. Special loss functions are designed to support the optimization of face morphing. Second, we extend the study of transformer-based face morphing to demorphing by presenting an effective defense strategy with access to a reference image using the same generator of MorphGANFormer. Such demorphing is conceptually similar to unmixing of hyperspectral images but operates in the latent (instead of pixel) space. Third, for the first time, we address a fundamental issue of vulnerability-detectability trade-off for face morphing studies. It is argued that neither doppelganger norrandom pair selection is optimal, and a Lagrangian multiplier-based approach should be used to achieve an improved trade-off between recognition vulnerability and attack detectability.
updated: Sat Feb 18 2023 19:09:11 GMT+0000 (UTC)
published: Sat Feb 18 2023 19:09:11 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト