arXiv reaDer
自然界で生成された顔: 安定拡散、ミッドジャーニー、DALL-E 2 の量的比較
Generated Faces in the Wild: Quantitative Comparison of Stable Diffusion, Midjourney and DALL-E 2
画像合成の分野は、ここ数年で大きな進歩を遂げました。最近のモデルは、驚くべき品質の画像を生成できます。顔などのいくつかの興味深いカテゴリでのこれらのモデルのきめの細かい評価はまだ不足しています。ここでは、Stable Diffusion、Midjourney、および DALL-E 2 を含む 3 つの一般的なシステムを、実際に写真のようにリアルな顔を生成する能力について定量的に比較します。 FID スコアによると、Stable Diffusion は他のシステムよりも優れた顔を生成することがわかりました。また、合計 15,076 の顔を含む、野生と呼ばれる GFW で生成された顔のデータセットも紹介します。さらに、私たちの研究が、生成モデルの評価と改善に関するフォローアップ研究に拍車をかけることを願っています。データとコードは、それぞれデータとコードで入手できます。
The field of image synthesis has made great strides in the last couple of years. Recent models are capable of generating images with astonishing quality. Fine-grained evaluation of these models on some interesting categories such as faces is still missing. Here, we conduct a quantitative comparison of three popular systems including Stable Diffusion, Midjourney, and DALL-E 2 in their ability to generate photorealistic faces in the wild. We find that Stable Diffusion generates better faces than the other systems, according to the FID score. We also introduce a dataset of generated faces in the wild dubbed GFW, including a total of 15,076 faces. Furthermore, we hope that our study spurs follow-up research in assessing the generative models and improving them. Data and code are available at data and code, respectively.
updated: Mon Jun 05 2023 20:25:22 GMT+0000 (UTC)
published: Sun Oct 02 2022 17:53:08 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト