arXiv reaDer
MeshTalk:クロスモダリティ解きほぐしを使用した音声からの3D顔アニメーション
MeshTalk: 3D Face Animation from Speech using Cross-Modality Disentanglement
この論文は、音声から完全な顔の3Dアニメーションを生成するための一般的な方法を提示します。オーディオ駆動の顔のアニメーションへの既存のアプローチは、不気味なまたは静的な上面のアニメーションを示し、正確でもっともらしい共同アーティキュレーションを生成できないか、スケーラビリティを制限する個人固有のモデルに依存しています。既存のモデルを改善するために、顔全体に対して非常にリアルなモーション合成結果を実現する、一般的なオーディオ駆動の顔アニメーションアプローチを提案します。私たちのアプローチの中核は、新しいクロスモダリティの喪失に基づいて、音声相関情報と音声非相関情報を解きほぐす、顔のアニメーションのためのカテゴリ別潜在空間です。私たちのアプローチは、まばたきや眉毛の動きなど、音声信号と相関のない顔の部分のもっともらしいアニメーションを合成しながら、非常に正確な唇の動きを保証します。私たちのアプローチがいくつかのベースラインを上回り、定性的および定量的に最先端の品質を獲得していることを示しています。知覚的なユーザー調査は、75%以上のケースで、私たちのアプローチが現在の最先端技術よりも現実的であると見なされていることを示しています。論文を読む前に補足ビデオを見ることをお勧めします:https://research.fb.com/wp-content/uploads/2021/04/mesh_talk.mp4
This paper presents a generic method for generating full facial 3D animation from speech. Existing approaches to audio-driven facial animation exhibit uncanny or static upper face animation, fail to produce accurate and plausible co-articulation or rely on person-specific models that limit their scalability. To improve upon existing models, we propose a generic audio-driven facial animation approach that achieves highly realistic motion synthesis results for the entire face. At the core of our approach is a categorical latent space for facial animation that disentangles audio-correlated and audio-uncorrelated information based on a novel cross-modality loss. Our approach ensures highly accurate lip motion, while also synthesizing plausible animation of the parts of the face that are uncorrelated to the audio signal, such as eye blinks and eye brow motion. We demonstrate that our approach outperforms several baselines and obtains state-of-the-art quality both qualitatively and quantitatively. A perceptual user study demonstrates that our approach is deemed more realistic than the current state-of-the-art in over 75% of cases. We recommend watching the supplemental video before reading the paper: https://research.fb.com/wp-content/uploads/2021/04/mesh_talk.mp4
updated: Fri Apr 16 2021 17:05:40 GMT+0000 (UTC)
published: Fri Apr 16 2021 17:05:40 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト