arXiv reaDer
安定拡散は不安定
Stable Diffusion is Unstable
最近では、テキストから画像へのモデルが人気を集めています。それらの強力な生成能力にもかかわらず、私たちの研究により、この生成プロセスには堅牢性が欠けていることが明らかになりました。具体的には、テキスト プロンプトに小さな摂動が導入されると、主要な主題が他のカテゴリと混ざり合ったり、生成された画像で完全に消えたりする可能性があります。この論文では、このような摂動を効果的かつ効率的に生成するための、勾配ベースのアプローチである Text-to-image Models (ATM) への自動攻撃を提案します。 Gumbel Softmax 分布を学習することで、単語の置換または拡張の離散的なプロセスを連続的に行うことができるため、摂動生成の微分可能性が保証されます。分布が学習されると、ATM は複数の攻撃サンプルを同時にサンプリングできます。これらの攻撃サンプルは、画質を損なうことなく、生成モデルが目的の被写体を生成することを妨げる可能性があります。 ATM は、短文攻撃で 91.1% の成功率、長文攻撃で 81.2% の成功率を達成しました。さらに実証分析を行った結果、1) 生成速度のばらつき、2) 粗粒度の特徴の類似性、3) 単語の多義性、4) 単語の位置に基づいた 4 つの攻撃パターンが明らかになりました。
Recently, text-to-image models have been thriving. Despite their powerful generative capacity, our research has uncovered a lack of robustness in this generation process. Specifically, the introduction of small perturbations to the text prompts can result in the blending of primary subjects with other categories or their complete disappearance in the generated images. In this paper, we propose Auto-attack on Text-to-image Models (ATM), a gradient-based approach, to effectively and efficiently generate such perturbations. By learning a Gumbel Softmax distribution, we can make the discrete process of word replacement or extension continuous, thus ensuring the differentiability of the perturbation generation. Once the distribution is learned, ATM can sample multiple attack samples simultaneously. These attack samples can prevent the generative model from generating the desired subjects without compromising image quality. ATM has achieved a 91.1% success rate in short-text attacks and an 81.2% success rate in long-text attacks. Further empirical analysis revealed four attack patterns based on: 1) the variability in generation speed, 2) the similarity of coarse-grained characteristics, 3) the polysemy of words, and 4) the positioning of words.
updated: Tue Jun 06 2023 04:28:17 GMT+0000 (UTC)
published: Mon Jun 05 2023 04:21:43 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト