arXiv reaDer
Composer: 構成可能な条件を使用したクリエイティブで制御可能な画像合成
Composer: Creative and Controllable Image Synthesis with Composable Conditions
ビッグデータで学習された最近の大規模な生成モデルは、信じられないほどの画像を合成できますが、制御性が限られています。この作品は、合成品質とモデルの創造性を維持しながら、空間レイアウトやパレットなどの出力画像を柔軟に制御できる新世代のパラダイムを提供します。構成性を中心的なアイデアとして、まず画像を代表的な要因に分解し、次にこれらすべての要因を入力を再構成する条件として拡散モデルをトレーニングします。推論段階では、豊富な中間表現が構成可能な要素として機能し、カスタマイズ可能なコンテンツ作成のための巨大な設計空間 (つまり、分解された要素の数に指数関数的に比例) につながります。 Composer と呼ばれる私たちのアプローチが、グローバル情報としてのテキスト記述、ローカル ガイダンスとしての深度マップとスケッチ、低レベルの詳細のためのカラー ヒストグラムなど、さまざまなレベルの条件をサポートしていることは注目に値します。 Composer が一般的なフレームワークとして機能し、再トレーニングなしで幅広い古典的な生成タスクを容易にすることを確認します。コードとモデルが利用可能になります。
Recent large-scale generative models learned on big data are capable of synthesizing incredible images yet suffer from limited controllability. This work offers a new generation paradigm that allows flexible control of the output image, such as spatial layout and palette, while maintaining the synthesis quality and model creativity. With compositionality as the core idea, we first decompose an image into representative factors, and then train a diffusion model with all these factors as the conditions to recompose the input. At the inference stage, the rich intermediate representations work as composable elements, leading to a huge design space (i.e., exponentially proportional to the number of decomposed factors) for customizable content creation. It is noteworthy that our approach, which we call Composer, supports various levels of conditions, such as text description as the global information, depth map and sketch as the local guidance, color histogram for low-level details, etc. Besides improving controllability, we confirm that Composer serves as a general framework and facilitates a wide range of classical generative tasks without retraining. Code and models will be made available.
updated: Wed Feb 22 2023 02:14:55 GMT+0000 (UTC)
published: Mon Feb 20 2023 05:48:41 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト