Learning to Evaluate the Artness of AI-generated Images
AI によって生成された画像の芸術性を評価することは、画像生成の分野では引き続き課題です。既存のメトリクスのほとんどは、インスタンス レベルおよびリファレンス フリーのアートネス評価を実行するために使用できません。この論文では、画像が芸術家による本物の芸術作品 (または逆に写真) にどの程度似ているかを評価するように設計された指標である ArtScore を提示し、それによって芸術性評価への新しいアプローチを提供します。最初に、写真とアートワークの生成用に事前トレーニング済みのモデルをブレンドし、一連の混合モデルを作成します。その後、これらの混合モデルを利用して、疑似アノテーションを使用してさまざまな程度の芸術性を示す画像を生成します。各フォトリアリスティック イメージには、対応する芸術的な対応物と、現実的なものから芸術的なものまでの一連の補間されたイメージがあります。次に、このデータセットを使用して、任意の画像の量子化された芸術性レベルを推定することを学習するニューラル ネットワークをトレーニングします。広範な実験により、ArtScore によって予測される芸術性レベルは、グラム損失や ArtFID などの既存の評価指標よりも人間の芸術的評価とより密接に一致することが明らかになりました。
Assessing the artness of AI-generated images continues to be a challenge within the realm of image generation. Most existing metrics cannot be used to perform instance-level and reference-free artness evaluation. This paper presents ArtScore, a metric designed to evaluate the degree to which an image resembles authentic artworks by artists (or conversely photographs), thereby offering a novel approach to artness assessment. We first blend pre-trained models for photo and artwork generation, resulting in a series of mixed models. Subsequently, we utilize these mixed models to generate images exhibiting varying degrees of artness with pseudo-annotations. Each photorealistic image has a corresponding artistic counterpart and a series of interpolated images that range from realistic to artistic. This dataset is then employed to train a neural network that learns to estimate quantized artness levels of arbitrary images. Extensive experiments reveal that the artness levels predicted by ArtScore align more closely with human artistic evaluation than existing evaluation metrics, such as Gram loss and ArtFID.
updated: Sun Jun 09 2024 16:13:12 GMT+0000 (UTC)
published: Mon May 08 2023 17:58:27 GMT+0000 (UTC)
