精度と再現率は、生成パフォーマンスの 2 つの著名な指標であり、生成モデルの忠実性と多様性を個別に測定するために提案されました。生成モデルの比較と改善における中心的な役割を考えると、その制限を理解することが非常に重要です。そのために、この研究では、k 最近傍法を使用したこれらのメトリクスの一般的な近似における重大な欠陥を特定します。つまり、精度と再現率に割り当てられる忠実度と多様性の解釈そのものが、高次元では失敗する可能性があるということです。非常に誤解を招く結論につながります。具体的には、次元数が増加するにつれて、実際の分布のサポートから等点距離にあるサポートを持つ 2 つのモデル分布は、それぞれの分布に関係なく、精度と再現率が大幅に異なる可能性があることを経験的および理論的に示します。高次元の非対称性。理論的な洞察に基づいて、これらのメトリクスにシンプルかつ効果的な変更を加えて、次元の数に関係なく対称メトリクスを構築します。最後に、特定された欠陥が単なる病理学的なケースではなく、提案された指標がその影響を軽減するのに効果的であることを示すために、実世界のデータセットでの実験を提供します。
Precision and Recall are two prominent metrics of generative performance, which were proposed to separately measure the fidelity and diversity of generative models. Given their central role in comparing and improving generative models, understanding their limitations are crucially important. To that end, in this work, we identify a critical flaw in the common approximation of these metrics using k-nearest-neighbors, namely, that the very interpretations of fidelity and diversity that are assigned to Precision and Recall can fail in high dimensions, resulting in very misleading conclusions. Specifically, we empirically and theoretically show that as the number of dimensions grows, two model distributions with supports at equal point-wise distance from the support of the real distribution, can have vastly different Precision and Recall regardless of their respective distributions, hence an emergent asymmetry in high dimensions. Based on our theoretical insights, we then provide simple yet effective modifications to these metrics to construct symmetric metrics regardless of the number of dimensions. Finally, we provide experiments on real-world datasets to illustrate that the identified flaw is not merely a pathological case, and that our proposed metrics are effective in alleviating its impact.