arXiv reaDer
解きほぐされたオーディオ表現を使用した顔のアニメーション化
Animating Face using Disentangled Audio Representations
  オーディオ駆動のトーキングヘッド生成の以前のすべての方法は、入力オーディオがニュートラルトーンでクリーンであると想定しています。経験的に示すように、発話に特定の背景ノイズを追加するか、感情的なトーンを(悲しいなどに)変更するだけで、これらのシステムを簡単に破ることができます。トーキングヘッドの生成をこのようなバリエーションに対してロバストにするために、音声シーケンスを音声コンテンツ、感情トーン、バックグラウンドノイズなどのさまざまな要因に分解する明示的な音声表現学習フレームワークを提案します。解きほぐされたコンテンツ表現を条件とする実験を実施し、モデルによって生成された口の動きは、ノイズや感情の変化がある場合、以前のアプローチ(解きほぐされた学習なし)よりもはるかに正確です。さらに、元の音声学習コンポーネントを弊社のフレームワークに置き換えることにより、フレームワークが現在の最先端のアプローチと互換性があることを実証します。私たちの知る限り、これは、解きほぐされたオーディオ表現の観点からトーキングヘッド生成のパフォーマンスを向上させる最初の作業であり、これは多くの実際のアプリケーションにとって重要です。
All previous methods for audio-driven talking head generation assume the input audio to be clean with a neutral tone. As we show empirically, one can easily break these systems by simply adding certain background noise to the utterance or changing its emotional tone (to such as sad). To make talking head generation robust to such variations, we propose an explicit audio representation learning framework that disentangles audio sequences into various factors such as phonetic content, emotional tone, background noise and others. We conduct experiments to validate that conditioned on disentangled content representation, the generated mouth movement by our model is significantly more accurate than previous approaches (without disentangled learning) in the presence of noise and emotional variations. We further demonstrate that our framework is compatible with current state-of-the-art approaches by replacing their original audio learning component with ours. To our best knowledge, this is the first work which improves the performance of talking head generation from disentangled audio representation perspective, which is important for many real-world applications.
updated: Wed Oct 02 2019 00:47:19 GMT+0000 (UTC)
published: Wed Oct 02 2019 00:47:19 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト