arXiv reaDer
LayoutDiffusion: 離散拡散確率モデルによるグラフィック レイアウト生成の改善
LayoutDiffusion: Improving Graphic Layout Generation by Discrete Diffusion Probabilistic Models
グラフィック レイアウトの作成は、グラフィック デザインの基本的なステップです。この作業では、自動レイアウト生成のための LayoutDiffusion という名前の新しい生成モデルを紹介します。レイアウトは通常、離散トークンのシーケンスとして表されるため、LayoutDiffusion はレイアウト生成を離散ノイズ除去拡散プロセスとしてモデル化します。順方向のステップの成長に伴ってレイアウトがますます混乱し、隣接するステップのレイアウトがあまり変わらない、穏やかな順方向プロセスを逆にすることを学習します。ただし、レイアウトにはカテゴリ属性と順序属性の両方があるため、このような穏やかな転送プロセスを設計することは非常に困難です。この課題に取り組むために、レイアウトの穏やかな前進プロセスを達成するための 3 つの重要な要素、つまり、合法性、座標の近接性、型の混乱を要約します。要因に基づいて、区分的な線形ノイズ スケジュールと組み合わせたブロック単位の遷移行列を提案します。 RICO および PubLayNet データセットの実験では、LayoutDiffusion が最先端のアプローチよりも大幅に優れていることが示されています。さらに、2 つの条件付きレイアウト生成タスクをプラグアンドプレイで再トレーニングなしで実行でき、既存の方法よりも優れたパフォーマンスを実現します。
Creating graphic layouts is a fundamental step in graphic designs. In this work, we present a novel generative model named LayoutDiffusion for automatic layout generation. As layout is typically represented as a sequence of discrete tokens, LayoutDiffusion models layout generation as a discrete denoising diffusion process. It learns to reverse a mild forward process, in which layouts become increasingly chaotic with the growth of forward steps and layouts in the neighboring steps do not differ too much. Designing such a mild forward process is however very challenging as layout has both categorical attributes and ordinal attributes. To tackle the challenge, we summarize three critical factors for achieving a mild forward process for the layout, i.e., legality, coordinate proximity and type disruption. Based on the factors, we propose a block-wise transition matrix coupled with a piece-wise linear noise schedule. Experiments on RICO and PubLayNet datasets show that LayoutDiffusion outperforms state-of-the-art approaches significantly. Moreover, it enables two conditional layout generation tasks in a plug-and-play manner without re-training and achieves better performance than existing methods.
updated: Tue Mar 21 2023 04:41:02 GMT+0000 (UTC)
published: Tue Mar 21 2023 04:41:02 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト