arXiv reaDer
強化された拡散ベースのテキストから画像への生成のための任意のスタイルガイダンス
Arbitrary Style Guidance for Enhanced Diffusion-Based Text-to-Image Generation
GLIDE や DALLE-2 などの拡散ベースのテキストから画像への生成モデルは、複雑なテキスト入力を高品質で幅広い多様性の画像に変換する優れたパフォーマンスにより、最近大きな成功を収めています。特に、さまざまな形式やスタイルのグラフィック アートを作成する際に非常に強力であることが証明されています。現在のモデルでは、油絵や鉛筆画などのスタイル形式の指定がサポートされていますが、色の分布やブラシ ストロークなどの細かいスタイル機能は、指定されたテキスト入力に基づいて条件付き分布からランダムに選択されるため、指定するのが困難です。ここでは、参照画像によって導かれる任意のスタイルを使用して画像を生成することをサポートする、新しいスタイル ガイダンス方法を提案します。この生成方法では、テキスト入力によって制御されるように、生成されたコンテンツの画質を維持しながら、目的のスタイルを生成するための個別のスタイル転送モデルは必要ありません。さらに、セルフ スタイル ガイダンスと呼ばれるスタイル参照なしでガイダンス メソッドを適用して、より多様なスタイルの画像を生成することもできます。包括的な実験により、提案された方法が、多様なグラフィックアート形式、画像コンテンツタイプ、拡散モデルなど、幅広い条件で堅牢で効果的であることが証明されています。
Diffusion-based text-to-image generation models like GLIDE and DALLE-2 have gained wide success recently for their superior performance in turning complex text inputs into images of high quality and wide diversity. In particular, they are proven to be very powerful in creating graphic arts of various formats and styles. Although current models supported specifying style formats like oil painting or pencil drawing, fine-grained style features like color distributions and brush strokes are hard to specify as they are randomly picked from a conditional distribution based on the given text input. Here we propose a novel style guidance method to support generating images using arbitrary style guided by a reference image. The generation method does not require a separate style transfer model to generate desired styles while maintaining image quality in generated content as controlled by the text input. Additionally, the guidance method can be applied without a style reference, denoted as self style guidance, to generate images of more diverse styles. Comprehensive experiments prove that the proposed method remains robust and effective in a wide range of conditions, including diverse graphic art forms, image content types and diffusion models.
updated: Mon Nov 14 2022 20:52:57 GMT+0000 (UTC)
published: Mon Nov 14 2022 20:52:57 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト