arXiv reaDer
DALLE-2の隠された語彙を発見する
Discovering the Hidden Vocabulary of DALLE-2
DALLE-2には、ばかげたプロンプトで画像を生成するために使用できる隠された語彙があるように見えることがわかりました。たとえば、Apoploe vesrreaitaisは鳥を意味し、Contarra ccetnxniams luryca tanniounons(時々)は虫や害虫を意味するようです。これらのプロンプトは、多くの場合、単独で一貫していることがありますが、組み合わせている場合もあります。ランダムに見えるが視覚的概念にある程度対応している単語を発見するためのブラックボックス方式を紹介します。これは、重要なセキュリティと解釈可能性の課題を生み出します。
We discover that DALLE-2 seems to have a hidden vocabulary that can be used to generate images with absurd prompts. For example, it seems that Apoploe vesrreaitais means birds and Contarra ccetnxniams luryca tanniounons (sometimes) means bugs or pests. We find that these prompts are often consistent in isolation but also sometimes in combinations. We present our black-box method to discover words that seem random but have some correspondence to visual concepts. This creates important security and interpretability challenges.
updated: Wed Jun 01 2022 01:14:48 GMT+0000 (UTC)
published: Wed Jun 01 2022 01:14:48 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト