ユーザーの制約に従って現実的なレイアウトを生成する条件付きグラフィック レイアウト生成は、まだ十分に研究されていない挑戦的なタスクです。まず、さまざまなユーザーの制約を柔軟かつ均一に処理する方法についての議論が限られています。第 2 に、レイアウトをユーザーの制約に適合させるために、既存の作業では生成品質が大幅に犠牲になることがよくあります。この作業では、上記の問題に取り組むために LayoutFormer++ を提案します。まず、さまざまな制約を柔軟に処理するために、さまざまなユーザー制約を事前定義された形式のトークンのシーケンスとして表す制約シリアル化スキームを提案します。次に、条件付きレイアウト生成をシーケンスからシーケンスへの変換として定式化し、基本アーキテクチャとして Transformer を使用したエンコーダー/デコーダー フレームワークを活用します。さらに、品質を損なうことなくレイアウトをユーザーの要件に合わせてより良くするために、デコードスペース制限戦略を提案します。具体的には、ユーザーの制約に確実に違反し、低品質のレイアウトになる可能性が高いオプションを無視して、予測された分布を枝刈りし、制限された分布からモデル サンプルを作成します。実験は、LayoutFormer++ が、より優れた生成品質と少ない制約違反の両方の点で、すべてのタスクで既存のアプローチよりも優れていることを示しています。
Conditional graphic layout generation, which generates realistic layouts according to user constraints, is a challenging task that has not been well-studied yet. First, there is limited discussion about how to handle diverse user constraints flexibly and uniformly. Second, to make the layouts conform to user constraints, existing work often sacrifices generation quality significantly. In this work, we propose LayoutFormer++ to tackle the above problems. First, to flexibly handle diverse constraints, we propose a constraint serialization scheme, which represents different user constraints as sequences of tokens with a predefined format. Then, we formulate conditional layout generation as a sequence-to-sequence transformation, and leverage encoder-decoder framework with Transformer as the basic architecture. Furthermore, to make the layout better meet user requirements without harming quality, we propose a decoding space restriction strategy. Specifically, we prune the predicted distribution by ignoring the options that definitely violate user constraints and likely result in low-quality layouts, and make the model samples from the restricted distribution. Experiments demonstrate that LayoutFormer++ outperforms existing approaches on all the tasks in terms of both better generation quality and less constraint violation.