arXiv reaDer
安定拡散に対するクエリフリーの敵対的攻撃のパイロット研究
A Pilot Study of Query-Free Adversarial Attack against Stable Diffusion
Stable Diffusion による Text-to-Image (T2I) 生成の記録破りのパフォーマンスにもかかわらず、その敵対的ロバスト性に対する研究の注意はあまり払われていません。この作業では、Stable Diffusion の敵対的攻撃生成の問題を研究し、エンド ツー エンドのモデル クエリがない場合でも敵対的テキスト プロンプトを取得できるかどうかを尋ねます。結果として生じる問題を「クエリフリー攻撃の生成」と呼びます。この問題を解決するために、T2I モデルの脆弱性がテキスト エンコーダー (たとえば、Stable Diffusion の攻撃に使用される CLIP テキスト エンコーダー) の堅牢性の欠如に根ざしていることを示します。このような洞察に基づいて、ターゲットを絞らないクエリフリー攻撃とターゲットを絞ったクエリフリー攻撃の両方を提案します。前者は、テキスト埋め込み空間で最も影響力のある次元に基づいて構築されており、これを操作可能なキー次元と呼びます。提案された攻撃を活用することにより、テキストプロンプトへの5文字の摂動のみが、安定拡散を使用して合成画像の大幅なコンテンツシフトを引き起こすことができることを経験的に示しています。さらに、提案されたターゲット攻撃は、拡散モデルを正確に操作して、ターゲットのない画像コンテンツに大きな変化を引き起こすことなく、ターゲットの画像コンテンツをスクラブできることを示します。
Despite the record-breaking performance in Text-to-Image (T2I) generation by Stable Diffusion, less research attention is paid to its adversarial robustness. In this work, we study the problem of adversarial attack generation for Stable Diffusion and ask if an adversarial text prompt can be obtained even in the absence of end-to-end model queries. We call the resulting problem 'query-free attack generation'. To resolve this problem, we show that the vulnerability of T2I models is rooted in the lack of robustness of text encoders, e.g., the CLIP text encoder used for attacking Stable Diffusion. Based on such insight, we propose both untargeted and targeted query-free attacks, where the former is built on the most influential dimensions in the text embedding space, which we call steerable key dimensions. By leveraging the proposed attacks, we empirically show that only a five-character perturbation to the text prompt is able to cause the significant content shift of synthesized images using Stable Diffusion. Moreover, we show that the proposed target attack can precisely steer the diffusion model to scrub the targeted image content without causing much change in untargeted image content.
updated: Wed Mar 29 2023 01:24:25 GMT+0000 (UTC)
published: Wed Mar 29 2023 01:24:25 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト