arXiv reaDer
CLIPScore:画像キャプションの参照なしの評価指標
CLIPScore: A Reference-free Evaluation Metric for Image Captioning
画像のキャプションは、従来、参照ベースの自動評価に依存しており、機械のキャプションが人間によって書かれたキャプションと比較されていました。これは、人間がキャプションの品質を評価する参照なしの方法とはまったく対照的です。この論文では、ウェブからの400Mの画像とキャプションのペアで事前トレーニングされたクロスモーダルモデルであるCLIP(Radford et al。、2021)を使用して、画像のキャプションを必要なく堅牢に自動評価できるという驚くべき経験的発見を報告します。参考のために。いくつかのコーパスにまたがる実験は、新しい参照なしのメトリックであるCLIPScoreが人間の判断との最高の相関を達成し、CIDErやSPICEなどの既存の参照ベースのメトリックを上回っていることを示しています。情報獲得実験は、画像とテキストの互換性に重点を置いたCLIPScoreが、テキストとテキストの類似性を強調する既存の参照ベースの指標を補完することを示しています。したがって、さらに高い相関を実現するリファレンス拡張バージョンのRefCLIPScoreも紹介します。文字通りの説明タスクを超えて、いくつかのケーススタディは、CLIPScoreがうまく機能するドメイン(クリップアート画像、代替テキストの評価)を明らかにしますが、参照ベースのメトリック(たとえば、より豊富なコンテキスト知識を必要とするニュースキャプション)と比較して比較的弱いドメインも明らかにします。
Image captioning has conventionally relied on reference-based automatic evaluations, where machine captions are compared against captions written by humans. This is in stark contrast to the reference-free manner in which humans assess caption quality. In this paper, we report the surprising empirical finding that CLIP (Radford et al., 2021), a cross-modal model pretrained on 400M image+caption pairs from the web, can be used for robust automatic evaluation of image captioning without the need for references. Experiments spanning several corpora demonstrate that our new reference-free metric, CLIPScore, achieves the highest correlation with human judgements, outperforming existing reference-based metrics like CIDEr and SPICE. Information gain experiments demonstrate that CLIPScore, with its tight focus on image-text compatibility, is complementary to existing reference-based metrics that emphasize text-text similarities. Thus, we also present a reference-augmented version, RefCLIPScore, which achieves even higher correlation. Beyond literal description tasks, several case studies reveal domains where CLIPScore performs well (clip-art images, alt-text rating), but also where it is relatively weaker vs reference-based metrics, e.g., news captions that require richer contextual knowledge.
updated: Sun Apr 18 2021 05:00:29 GMT+0000 (UTC)
published: Sun Apr 18 2021 05:00:29 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト