arXiv reaDer
CCLAP: 潜在拡散モデルによる制御可能な中国の風景画の生成
CCLAP: Controllable Chinese Landscape Painting Generation via Latent Diffusion Model
深い生成モデルの開発により、近年、中国の風景画の生成が大きな成功を収めています。しかし、データが不足しており、モデリング機能が限られているため、制御可能な中国の風景画の生成に焦点を当てた研究はほとんどありません。この作業では、潜在拡散モデルに基づいて特定のコンテンツとスタイルの絵画を生成できる、CCLAP という名前の制御可能な中国の風景画生成方法を提案します。具体的には、コンテンツ ジェネレーターとスタイル アグリゲーターの 2 つのカスケード モジュールで構成されます。コンテンツ ジェネレーター モジュールは、入力テキストに固有の生成された絵画のコンテンツを保証します。スタイルアグリゲーターモジュールは、参照画像に対応するスタイルの絵画を生成することです。さらに、CLAP という名前の中国の風景画の新しいデータセットが収集され、包括的な評価が行われます。定性的および定量的な結果の両方が、特に巧みに構成された芸術的な概念において、私たちの方法が最先端のパフォーマンスを達成することを示しています。コードは https://github.com/Robin-WZQ/CCLAP で入手できます。
With the development of deep generative models, recent years have seen great success of Chinese landscape painting generation. However, few works focus on controllable Chinese landscape painting generation due to the lack of data and limited modeling capabilities. In this work, we propose a controllable Chinese landscape painting generation method named CCLAP, which can generate painting with specific content and style based on Latent Diffusion Model. Specifically, it consists of two cascaded modules, i.e., content generator and style aggregator. The content generator module guarantees the content of generated paintings specific to the input text. While the style aggregator module is to generate paintings of a style corresponding to a reference image. Moreover, a new dataset of Chinese landscape paintings named CLAP is collected for comprehensive evaluation. Both the qualitative and quantitative results demonstrate that our method achieves state-of-the-art performance, especially in artfully-composed and artistic conception. Codes are available at https://github.com/Robin-WZQ/CCLAP.
updated: Sun Apr 09 2023 04:16:28 GMT+0000 (UTC)
published: Sun Apr 09 2023 04:16:28 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト