arXiv reaDer
適合率が証明可能な深層学習のための適合率-再現率曲線の下の領域の確率的最適化
Stochastic Optimization of Area Under Precision-Recall Curve for Deep Learning with Provable Convergence
ROC(AUROC)および適合率-再現率曲線(AUPRC)の下の領域は、不均衡な問題の分類パフォーマンスを評価するための一般的なメトリックです。 AUROCと比較して、AUPRCは、非常に不均衡なデータセットに対してより適切なメトリックです。 AUROCの直接最適化は広く研究されてきましたが、AUPRCの最適化はめったに検討されていません。この作業では、深層学習のためにAUPRCを最適化するための原理的な技術的方法を提案します。私たちのアプローチは、AUPRCの不偏点推定量である平均精度(AP)を最大化することに基づいています。 APの代理損失関数は非常に非凸であり、AUROCの関数よりも複雑であることを示します。目的を、外部レベルの確率変数に依存する内部関数を持つ従属構成関数の合計にキャストします。確率的組成最適化の最近の進歩を使用することにより、穏やかな条件下で証明可能な収束保証を備えた効率的な適応型および非適応型の確率的アルゴリズムを提案します。グラフと画像データセットに関する広範な実験結果は、提案された方法が不均衡な問題に関する以前の方法よりも優れていることを示しています。私たちの知る限り、私たちの仕事は、証明可能な収束でAUPRCを最適化する最初の試みを表しています。
Areas under ROC (AUROC) and precision-recall curves (AUPRC) are common metrics for evaluating classification performance for imbalanced problems. Compared with AUROC, AUPRC is a more appropriate metric for highly imbalanced datasets. While direct optimization of AUROC has been studied extensively, optimization of AUPRC has been rarely explored. In this work, we propose a principled technical method to optimize AUPRC for deep learning. Our approach is based on maximizing the averaged precision (AP), which is an unbiased point estimator of AUPRC. We show that the surrogate loss function for AP is highly non-convex and more complicated than that of AUROC. We cast the objective into a sum of dependent compositional functions with inner functions dependent on random variables of the outer level. We propose efficient adaptive and non-adaptive stochastic algorithms with provable convergence guarantee under mild conditions by using recent advances in stochastic compositional optimization. Extensive experimental results on graphs and image datasets demonstrate that our proposed method outperforms prior methods on imbalanced problems. To the best of our knowledge, our work represents the first attempt to optimize AUPRC with provable convergence.
updated: Sun Apr 18 2021 06:22:21 GMT+0000 (UTC)
published: Sun Apr 18 2021 06:22:21 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト