バイナリ分類器のパフォーマンスは、真陽性 (TP)、真陰性 (TN)、偽陽性 (FP)、および偽陰性 (FN) の 4 つのエントリを持つ混同行列によって記述されます。マシューの相関係数 (MCC)、F1、および Fowlkes--Mallows (FM) スコアは、混同行列を要約するスカラーです。 F1 スコアと FM スコアはどちらも、混同行列の 4 つのエントリのうち 3 つだけに基づいています (TN は無視されます)。対照的に、MCC は混同行列の 4 つのエントリすべてを考慮に入れるため、より代表的な図を提供していると見なすことができます。ただし、オブジェクト検出の問題では、真陰性の数を測定することは非常に多く、扱いにくいことがよくあります。したがって、真陰性の数が無限に近づくと、MCC はどうなるでしょうか?このホワイト ペーパーでは、真陰性の数が無限大に近づくにつれて、FM 測定値が MCC の限界に等しいことを証明することにより、MCC と FM スコアの関係についての洞察を提供します。
The performance of a binary classifier is described by a confusion matrix with four entries: the number of true positives (TP), true negatives (TN), false positives (FP), and false negatives (FN). The Matthew's Correlation Coefficient (MCC), F1, and Fowlkes--Mallows (FM) scores are scalars that summarize a confusion matrix. Both the F1 and FM scores are based on only three of the four entries in the confusion matrix (they ignore TN). In contrast, the MCC takes into account all four entries of the confusion matrix and thus can be seen as providing a more representative picture. However, in object detection problems, measuring the number of true negatives is so large it is often intractable. Thus we ask, what happens to the MCC as the number of true negatives approaches infinity? This paper provides insight into the relationship between the MCC and FM score by proving that the FM-measure is equal to the limit of the MCC as the number of true negatives approaches infinity.