arXiv reaDer
オブジェクト中心の画像生成のためのリレーショナル誘導バイアス
Relational Inductive Biases for Object-Centric Image Generation
目的の出力の特定の機能に基づいて画像生成を調整することは、最新の生成モデルの重要な要素です。既存のアプローチのほとんどは、自由形式のテキストに基づいて生成を調整することに焦点を当てていますが、一部のニッチな研究では、シーン グラフを使用して、生成される画像の内容を記述しています。このペーパーでは、オブジェクト中心の関係表現に基づく画像生成を調整するための新しい方法について説明します。特に、構造と関連するスタイルを表す属性付きグラフ上の画像内の特定のオブジェクトの生成を調整する方法論を提案します。このようなアーキテクチャのバイアスには、生成プロセスの操作と調整を容易にし、トレーニング手順の正規化を可能にするプロパティが伴うことを示します。提案されたフレームワークは、基になるグラフと出力画像になる 2D グリッドの両方で動作する畳み込み演算子を組み合わせたニューラル ネットワーク アーキテクチャによって実装されます。結果として得られるモデルは、下流の生成タスクでソフト誘導バイアスとして使用できるオブジェクトのマルチチャネル マスクを生成することを学習します。経験的結果は、提案されたアプローチが、人間のポーズを条件とした画像生成に関する関連するベースラインと比較して有利であることを示しています。
Conditioning image generation on specific features of the desired output is a key ingredient of modern generative models. Most existing approaches focus on conditioning the generation based on free-form text, while some niche studies use scene graphs to describe the content of the image to be generated. This paper explores novel methods to condition image generation that are based on object-centric relational representations. In particular, we propose a methodology to condition the generation of a particular object in an image on the attributed graph representing its structure and associated style. We show that such architectural biases entail properties that facilitate the manipulation and conditioning of the generative process and allow for regularizing the training procedure. The proposed framework is implemented by means of a neural network architecture combining convolutional operators that operate on both the underlying graph and the 2D grid that becomes the output image. The resulting model learns to generate multi-channel masks of the object that can be used as a soft inductive bias in the downstream generative task. Empirical results show that the proposed approach compares favorably against relevant baselines on image generation conditioned on human poses.
updated: Sun Mar 26 2023 11:17:17 GMT+0000 (UTC)
published: Sun Mar 26 2023 11:17:17 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト