arXiv reaDer
固有次元のレンズを通して安定拡散の表現多様体を探る
Exploring the Representation Manifolds of Stable Diffusion Through the Lens of Intrinsic Dimension
プロンプトは、ユーザーがさまざまな種類の基盤モデルとより効果的にやり取りできるようにするための重要なメカニズムになりました。実際、ここ数年は、よく研ぎ澄まされたプロンプトによって、そのようなモデル内で新たな機能が解き放たれることがあることが示されています。コミュニティ内でのプロンプトの経験的調査はかなりの量で行われてきましたが、数学レベルでプロンプトを研究した研究は比較的少数です。この作業では、モデル内の内部表現の固有の次元に焦点を当てて、安定拡散のプロンプトによって誘発される基本的な幾何学的特性を理解するための第一歩を踏み出すことを目指しています。プロンプトの選択は、調査したモデルの両方のレイヤーでの表現の固有の次元に大きな影響を与えることがわかりましたが、この影響の性質は、考慮されているレイヤーに依存することがわかりました。たとえば、モデルの特定のボトルネック層では、表現の固有の次元がプロンプトの困惑 (代理モデルを使用して測定) と相関していますが、この相関は潜在層では明らかではありません。私たちの証拠は、本質的な次元が、テキストから画像へのモデルに対するさまざまなプロンプトの影響に関する将来の研究に役立つツールになる可能性があることを示唆しています。
Prompting has become an important mechanism by which users can more effectively interact with many flavors of foundation model. Indeed, the last several years have shown that well-honed prompts can sometimes unlock emergent capabilities within such models. While there has been a substantial amount of empirical exploration of prompting within the community, relatively few works have studied prompting at a mathematical level. In this work we aim to take a first step towards understanding basic geometric properties induced by prompts in Stable Diffusion, focusing on the intrinsic dimension of internal representations within the model. We find that choice of prompt has a substantial impact on the intrinsic dimension of representations at both layers of the model which we explored, but that the nature of this impact depends on the layer being considered. For example, in certain bottleneck layers of the model, intrinsic dimension of representations is correlated with prompt perplexity (measured using a surrogate model), while this correlation is not apparent in the latent layers. Our evidence suggests that intrinsic dimension could be a useful tool for future studies of the impact of different prompts on text-to-image models.
updated: Thu Feb 16 2023 16:22:30 GMT+0000 (UTC)
published: Thu Feb 16 2023 16:22:30 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト