arXiv reaDer
LaMD: ビデオ生成のための潜在的な動きの拡散
LaMD: Latent Motion Diffusion for Video Generation
首尾一貫した自然な動きを生成することは、ビデオ生成における重要な課題です。この研究では、ビデオ生成をモーション生成の問題に凝縮し、モーションの表現力を向上させ、ビデオ生成をより管理しやすくすることを提案します。これは、ビデオ生成プロセスを潜在的な動きの生成とビデオの再構成に分解することで実現できます。このアイデアを実装するために、モーション分解ビデオオートエンコーダと拡散ベースのモーションジェネレータで構成される潜在モーション拡散(LaMD)フレームワークを提示します。慎重な設計により、モーション分解ビデオ オートエンコーダーは、動きのパターンを簡潔な潜在モーション表現に圧縮できます。一方、拡散ベースのモーションジェネレーターは、画像拡散モデルと同様のコストで、マルチモーダル条件下で連続的な潜在空間で現実的なモーションを効率的に生成できます。結果は、LaMD が、確率力学から高度に制御可能な動きまで、幅広い動きで高品質のビデオを生成することを示しています。 Image-to-Video (I2V) および Text-Image-to-Video (TI2V) 生成のために、BAIR、Landscape、CATER-GEN などのベンチマーク データセットで新しい最先端のパフォーマンスを実現します。 LaMD のソースコードは近日公開予定です。
Generating coherent and natural movement is the key challenge in video generation. This research proposes to condense video generation into a problem of motion generation, to improve the expressiveness of motion and make video generation more manageable. This can be achieved by breaking down the video generation process into latent motion generation and video reconstruction. We present a latent motion diffusion (LaMD) framework, which consists of a motion-decomposed video autoencoder and a diffusion-based motion generator, to implement this idea. Through careful design, the motion-decomposed video autoencoder can compress patterns in movement into a concise latent motion representation. Meanwhile, the diffusion-based motion generator is able to efficiently generate realistic motion on a continuous latent space under multi-modal conditions, at a cost that is similar to that of image diffusion models. Results show that LaMD generates high-quality videos with a wide range of motions, from stochastic dynamics to highly controllable movements. It achieves new state-of-the-art performance on benchmark datasets, including BAIR, Landscape and CATER-GENs, for Image-to-Video (I2V) and Text-Image-to-Video (TI2V) generation. The source code of LaMD will be made available soon.
updated: Sun Apr 23 2023 10:32:32 GMT+0000 (UTC)
published: Sun Apr 23 2023 10:32:32 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト