潜在拡散モデルは、画像合成や画像編集などのさまざまな生成タスクで最先端のパフォーマンスを実現します。ただし、潜在拡散モデルの堅牢性については十分に研究されていません。以前の研究では、ノイズ除去プロセスに関係なく、ホワイトボックス設定でのエンコーダーまたは出力画像に対する敵対的攻撃のみに焦点を当てていました。したがって、この論文では、潜在拡散モデルのロバスト性をより徹底的に分析することを目的としています。まず、潜在拡散モデル内のコンポーネントがホワイトボックスの堅牢性に及ぼす影響を研究します。ホワイトボックスシナリオに加えて、転送攻撃による潜在拡散モデルのブラックボックス堅牢性を評価し、即時転送設定とモデル転送設定の両方、および考えられる防御メカニズムを考慮します。ただし、これらすべての調査には包括的なベンチマーク データセットが必要ですが、これは文献にありません。そこで、潜在拡散モデルの堅牢性の研究を容易にするために、2種類の画像編集モデルに対して2つの自動データセット構築パイプラインを提案し、データセット全体を公開します。私たちのコードとデータセットは https://github.com/jpzhang1810/LDM-Robustness で入手できます。
Latent diffusion models achieve state-of-the-art performance on a variety of generative tasks, such as image synthesis and image editing. However, the robustness of latent diffusion models is not well studied. Previous works only focus on the adversarial attacks against the encoder or the output image under white-box settings, regardless of the denoising process. Therefore, in this paper, we aim to analyze the robustness of latent diffusion models more thoroughly. We first study the influence of the components inside latent diffusion models on their white-box robustness. In addition to white-box scenarios, we evaluate the black-box robustness of latent diffusion models via transfer attacks, where we consider both prompt-transfer and model-transfer settings and possible defense mechanisms. However, all these explorations need a comprehensive benchmark dataset, which is missing in the literature. Therefore, to facilitate the research of the robustness of latent diffusion models, we propose two automatic dataset construction pipelines for two kinds of image editing models and release the whole dataset. Our code and dataset are available at https://github.com/jpzhang1810/LDM-Robustness.