arXiv reaDer
強化されたもつれの解消により、スキップ接続なしで顔交換が可能
Reinforced Disentanglement for Face Swapping without Skip Connection
SOTA 顔交換モデルは依然として、ターゲットのアイデンティティ (つまり、形状) が漏洩するか、ターゲットの非アイデンティティ属性 (つまり、背景、髪) が最終結果に完全に保存されないという問題に悩まされています。我々は、この不十分なもつれの解消が、以前のモデルで一般的に採用されていた 2 つの欠陥のある設計によって引き起こされていることを示します。 (1) 意味論的レベルの非同一性の顔の属性 (つまり、ポーズ) とピクセルの両方を表すために 1 つの圧縮エンコーダのみに依存している。顔以外の領域の詳細レベルを同時に満たすことは矛盾しています。 (2) エンコーダーと最終ジェネレーター間の長いスキップ接続に大きく依存しており、ある程度のターゲットの顔のアイデンティティが結果に漏れます。これらを修正するために、「WSC-swap」と呼ばれる新しい顔スワップ フレームワークを導入します。これは、スキップ接続を取り除き、2 つのターゲット エンコーダを使用して、ピクセル レベルの顔以外の領域属性と顔のセマンティックな非アイデンティティ属性をそれぞれキャプチャします。領域。ターゲットエンコーダの解絡学習をさらに強化するために、敵対的トレーニング (つまり GAN) によるアイデンティティ除去損失と、[11] のような以前の 3DMM モデルによる非アイデンティティ保存損失の両方を採用します。 FaceForensics++ と CelebA-HQ の両方に関する広範な実験により、私たちの結果は、以前は完全に無視されていたアイデンティティの一貫性を測定するための 1 つの新しい指標を含む、豊富な指標セットで以前の研究を大幅に上回る結果を示しています。
The SOTA face swap models still suffer the problem of either target identity (i.e., shape) being leaked or the target non-identity attributes (i.e., background, hair) failing to be fully preserved in the final results. We show that this insufficient disentanglement is caused by two flawed designs that were commonly adopted in prior models: (1) counting on only one compressed encoder to represent both the semantic-level non-identity facial attributes(i.e., pose) and the pixel-level non-facial region details, which is contradictory to satisfy at the same time; (2) highly relying on long skip-connections between the encoder and the final generator, leaking a certain amount of target face identity into the result. To fix them, we introduce a new face swap framework called 'WSC-swap' that gets rid of skip connections and uses two target encoders to respectively capture the pixel-level non-facial region attributes and the semantic non-identity attributes in the face region. To further reinforce the disentanglement learning for the target encoder, we employ both identity removal loss via adversarial training (i.e., GAN) and the non-identity preservation loss via prior 3DMM models like [11]. Extensive experiments on both FaceForensics++ and CelebA-HQ show that our results significantly outperform previous works on a rich set of metrics, including one novel metric for measuring identity consistency that was completely neglected before.
updated: Sun Jul 16 2023 02:44:19 GMT+0000 (UTC)
published: Sun Jul 16 2023 02:44:19 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト