arXiv reaDer
希少性スコア:合成画像の珍しさを評価するための新しい指標
Rarity Score : A New Metric to Evaluate the Uncommonness of Synthesized Images
画像合成の評価指標は、生成モデルのパフォーマンスを測定するために重要な役割を果たします。ただし、ほとんどのメトリックは主に画像の忠実度に焦点を当てています。既存のダイバーシティメトリックは、分布を比較することによって導出されるため、生成された各画像のダイバーシティまたは希少度を定量化することはできません。この作業では、生成モデルによって合成された各画像の個々の希少性を測定するために、「希少性スコア」と呼ばれる新しい評価指標を提案します。最初に、一般的なサンプルが互いに近く、まれなサンプルが特徴空間の最近傍距離で互いに遠くにあるという経験的観察を示します。次に、メトリックを使用して、さまざまな生成モデルがまれな画像を生成する程度を効果的に比較できることを示します。また、CelebA-HQやFFHQなどの同じ概念を共有するデータセット間で希少性を比較する方法を提案します。最後に、特徴空間のさまざまな設計でのメトリックの使用を分析して、特徴空間と結果のまばらな画像との関係をよりよく理解します。コードは、研究コミュニティ向けにオンラインで公開されます。
Evaluation metrics in image synthesis play a key role to measure performances of generative models. However, most metrics mainly focus on image fidelity. Existing diversity metrics are derived by comparing distributions, and thus they cannot quantify the diversity or rarity degree of each generated image. In this work, we propose a new evaluation metric, called `rarity score', to measure the individual rarity of each image synthesized by generative models. We first show empirical observation that common samples are close to each other and rare samples are far from each other in nearest-neighbor distances of feature space. We then use our metric to demonstrate that the extent to which different generative models produce rare images can be effectively compared. We also propose a method to compare rarities between datasets that share the same concept such as CelebA-HQ and FFHQ. Finally, we analyze the use of metrics in different designs of feature spaces to better understand the relationship between feature spaces and resulting sparse images. Code will be publicly available online for the research community.
updated: Fri Jun 17 2022 05:16:16 GMT+0000 (UTC)
published: Fri Jun 17 2022 05:16:16 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト