arXiv reaDer
SMURF: 典型性分析によるキャプション評価のための意味論的および言語学的な理解不能な融合
SMURF: SeMantic and linguistic UndeRstanding Fusion for Caption Evaluation via Typicality Analysis
ビジュアル キャプションには無限の性質があるため、評価が難しい領域になっています。提案されたモデルの大部分は、人間の相関関係を改善するための特殊なトレーニングに依存しているため、採用、一般化可能性、および説明可能性が制限されています。情報理論に基づいた新しい評価の定式化である「典型性」を紹介します。これは、明確なグラウンド トゥルースを欠いている問題に固有に適しています。典型性は、新しい意味論的比較、SPARCS、および参照なしの流暢性評価指標を開発するためのフレームワークとして機能します。私たちの分析の過程で、流暢さの 2 つの異なる次元が自然に浮かび上がります。すなわち、メトリック SPURTS によって捕らえられたスタイルと、文法的外れ値ペナルティの形で捕らえられた文法です。ベンチマーク データセットに関する広範な実験とアブレーション研究を通じて、セマンティクスと流暢さのこれらの分解された次元が、キャプターの違いに関するより優れたシステム レベルの洞察をどのように提供するかを示します。私たちが提案する指標とその組み合わせである SMURF は、他のルールベースの評価指標と比較して、人間の判断と最先端の相関関係を実現します。
The open-ended nature of visual captioning makes it a challenging area for evaluation. The majority of proposed models rely on specialized training to improve human-correlation, resulting in limited adoption, generalizability, and explainabilty. We introduce "typicality", a new formulation of evaluation rooted in information theory, which is uniquely suited for problems lacking a definite ground truth. Typicality serves as our framework to develop a novel semantic comparison, SPARCS, as well as referenceless fluency evaluation metrics. Over the course of our analysis, two separate dimensions of fluency naturally emerge: style, captured by metric SPURTS, and grammar, captured in the form of grammatical outlier penalties. Through extensive experiments and ablation studies on benchmark datasets, we show how these decomposed dimensions of semantics and fluency provide greater system-level insight into captioner differences. Our proposed metrics along with their combination, SMURF, achieve state-of-the-art correlation with human judgment when compared with other rule-based evaluation metrics.
updated: Wed Jun 02 2021 19:58:20 GMT+0000 (UTC)
published: Wed Jun 02 2021 19:58:20 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト