arXiv reaDer
Using theoretical ROC curves for analysing machine learning binary classifiers
  ほとんどのバイナリ分類器は、入力を処理してスカラー応答を生成し、それをしきい値と比較することにより機能します。分類器のパフォーマンスのさまざまな尺度は、明示的または暗黙的に、いずれかのクラスに属する応答の確率分布$ P_s $および$ P_n $、各タイプの誤分類のコストの確率分布を想定し、予想コストからパフォーマンススコアを計算します。機械学習では、分類子の応答は実験的に取得され、パフォーマンススコアは$ P_s $と$ P_n $を仮定せずにそれらから直接計算されます。ここで、$ P_s $と$ P_n $の理論上の分布を推定する省略されたステップが役立つと主張します。バイオメトリックセキュリティの例では、ベータ分布を2つの分類子の応答に適合させます。1つはロジスティック回帰に基づき、もう1つはANNに基づいて、ROCの終わりに異なる極値動作を持つ少数のクラスに分類します。曲線。
Most binary classifiers work by processing the input to produce a scalar response and comparing it to a threshold value. The various measures of classifier performance assume, explicitly or implicitly, probability distributions $P_s$ and $P_n$ of the response belonging to either class, probability distributions for the cost of each type of misclassification, and compute a performance score from the expected cost. In machine learning, classifier responses are obtained experimentally and performance scores are computed directly from them, without any assumptions on $P_s$ and $P_n$. Here, we argue that the omitted step of estimating theoretical distributions for $P_s$ and $P_n$ can be useful. In a biometric security example, we fit beta distributions to the responses of two classifiers, one based on logistic regression and one on ANNs, and use them to establish a categorisation into a small number of classes with different extremal behaviours at the ends of the ROC curves.
updated: Sat Sep 21 2019 11:48:19 GMT+0000 (UTC)
published: Sat Sep 21 2019 11:48:19 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト