arXiv reaDer
FACIAL:暗黙の属性学習を使用した動的な話す顔の合成
FACIAL: Synthesizing Dynamic Talking Face with Implicit Attribute Learning
本論文では、音声信号を入力とし、短いターゲットビデオクリップを参照し、自然な唇の動き、頭のポーズ、まばたきを用いてターゲットの顔の写実的なビデオを合成する、話す顔の生成方法を提案します。入力オーディオ信号と同期しています。合成顔属性には、音声との相関が高い唇の動きなどの明示的な属性だけでなく、入力オーディオとの相関が弱い頭のポーズやまばたきなどの暗黙的な属性も含まれることに注意してください。入力音声を使用してさまざまな顔属性間のこのような複雑な関係をモデル化するために、FACe Implicit Attribute Learning Generative Adversarial Network(FACIAL-GAN)を提案します。これは、音声認識、コンテキスト認識、およびID認識の情報を統合して3D顔を合成します。唇、頭のポーズ、まばたきのリアルな動きを伴うアニメーション。次に、Rendering-to-Videoネットワークは、レンダリングされた顔画像を取得し、目の点滅のアテンションマップを入力として取得して、フォトリアリスティックな出力ビデオフレームを生成します。実験結果とユーザー調査によると、私たちの方法は、同期した唇の動きだけでなく、自然な頭の動きやまばたきも備えたリアルなトーキングフェイスビデオを生成でき、最先端の方法の結果よりも優れた品質を備えています。
In this paper, we propose a talking face generation method that takes an audio signal as input and a short target video clip as reference, and synthesizes a photo-realistic video of the target face with natural lip motions, head poses, and eye blinks that are in-sync with the input audio signal. We note that the synthetic face attributes include not only explicit ones such as lip motions that have high correlations with speech, but also implicit ones such as head poses and eye blinks that have only weak correlation with the input audio. To model such complicated relationships among different face attributes with input audio, we propose a FACe Implicit Attribute Learning Generative Adversarial Network (FACIAL-GAN), which integrates the phonetics-aware, context-aware, and identity-aware information to synthesize the 3D face animation with realistic motions of lips, head poses, and eye blinks. Then, our Rendering-to-Video network takes the rendered face images and the attention map of eye blinks as input to generate the photo-realistic output video frames. Experimental results and user studies show our method can generate realistic talking face videos with not only synchronized lip motions, but also natural head movements and eye blinks, with better qualities than the results of state-of-the-art methods.
updated: Wed Aug 18 2021 02:10:26 GMT+0000 (UTC)
published: Wed Aug 18 2021 02:10:26 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト