arXiv reaDer
CLIP-Layout: セマンティック家具埋め込みによるスタイル一貫性のある屋内シーンの合成
CLIP-Layout: Style-Consistent Indoor Scene Synthesis with Semantic Furniture Embedding
屋内シーンの合成では、フロア プラン上で家具を自動的に選択して適切に配置するため、シーンが現実的に見え、機能的に妥当なものになります。このようなシーンは、没入型 3D エクスペリエンスのためのホームとして機能したり、実体化されたエージェントを訓練するために使用したりできます。このタスクの既存の方法は、ベッド、椅子、テーブルなどの家具のラベル付けされたカテゴリに依存して、状況に応じて関連する家具の組み合わせを生成します。ヒューリスティックか学習かにかかわらず、これらのメソッドはオブジェクトのインスタンス レベルの視覚属性を無視するため、結果として視覚的に一貫性の低いシーンが生成される可能性があります。この論文では、CLIP に基づく汎用画像埋め込みを使用して、インスタンスレベルの予測を出力できる自動回帰シーン モデルを紹介します。これにより、色やスタイルの一致などの視覚的な対応関係を学習し、より機能的で審美的に美しいシーンを生成できるようになります。 3D-FRONT データセットで評価されたモデルは、シーン合成で SOTA の結果を達成し、オートコンプリート メトリクスを 50% 以上改善しました。さらに、埋め込みベースのアプローチにより、ゼロショットのテキストガイドによるシーンの合成と編集が可能になり、トレーニング中に表示されなかった家具にも簡単に一般化できます。
Indoor scene synthesis involves automatically picking and placing furniture appropriately on a floor plan, so that the scene looks realistic and is functionally plausible. Such scenes can serve as homes for immersive 3D experiences, or be used to train embodied agents. Existing methods for this task rely on labeled categories of furniture, e.g. bed, chair or table, to generate contextually relevant combinations of furniture. Whether heuristic or learned, these methods ignore instance-level visual attributes of objects, and as a result may produce visually less coherent scenes. In this paper, we introduce an auto-regressive scene model which can output instance-level predictions, using general purpose image embedding based on CLIP. This allows us to learn visual correspondences such as matching color and style, and produce more functionally plausible and aesthetically pleasing scenes. Evaluated on the 3D-FRONT dataset, our model achieves SOTA results in scene synthesis and improves auto-completion metrics by over 50%. Moreover, our embedding-based approach enables zero-shot text-guided scene synthesis and editing, which easily generalizes to furniture not seen during training.
updated: Fri Jun 02 2023 04:48:55 GMT+0000 (UTC)
published: Tue Mar 07 2023 00:26:02 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト