条件付き生成的敵対ネットワーク(cGAN)は、多くのアプリケーションドメインでますます広く使用されています。顕著な進歩にもかかわらず、そのようなモデルの定量的評価には、多くの場合、画質、条件付き一貫性、イントラコンディショニングの多様性など、さまざまな望ましい特性を評価するための複数の異なるメトリックが含まれます。この設定では、各メトリックが異なる「最適な」モデルを示す可能性があるため、モデルのベンチマークは課題になります。本論文では、画像と調整の結合分布間のフレシェ距離として定義されるフレシェ結合距離(FJD)を提案し、単一のメトリックで前述のプロパティを暗黙的にキャプチャできるようにします。制御可能な合成データセットで概念実証実験を実施します。これは、現在確立されているメトリックと比較した場合に、FJDの利点を一貫して強調しています。さらに、新しく導入されたメトリックを使用して、さまざまな条件付けモダリティ(クラスラベル、オブジェクトマスク、境界ボックス、画像、テキストキャプションなど)の既存のcGANベースのモデルを比較します。 FGADは、cGANベンチマークとモデル選択の有望な単一のメトリックとして使用できることを示します。コードはhttps://github.com/facebookresearch/fjdにあります。
Conditional Generative Adversarial Networks (cGANs) are finding increasingly widespread use in many application domains. Despite outstanding progress, quantitative evaluation of such models often involves multiple distinct metrics to assess different desirable properties, such as image quality, conditional consistency, and intra-conditioning diversity. In this setting, model benchmarking becomes a challenge, as each metric may indicate a different "best" model. In this paper, we propose the Frechet Joint Distance (FJD), which is defined as the Frechet distance between joint distributions of images and conditioning, allowing it to implicitly capture the aforementioned properties in a single metric. We conduct proof-of-concept experiments on a controllable synthetic dataset, which consistently highlight the benefits of FJD when compared to currently established metrics. Moreover, we use the newly introduced metric to compare existing cGAN-based models for a variety of conditioning modalities (e.g. class labels, object masks, bounding boxes, images, and text captions). We show that FJD can be used as a promising single metric for cGAN benchmarking and model selection. Code can be found at https://github.com/facebookresearch/fjd.