arXiv reaDer
大規模でロバストなディープAUC最大化:医用画像分類に関する新しい代理損失と経験的研究
Large-scale Robust Deep AUC Maximization: A New Surrogate Loss and Empirical Studies on Medical Image Classification
ディープAUC最大化(DAM)は、データセット上のモデルのAUCスコアを最大化することにより、ディープニューラルネットワークを学習するための新しいパラダイムです。 AUC最大化のこれまでのほとんどの作業は、効率的な確率的アルゴリズムを設計することによる最適化の観点に焦点を当てており、困難なタスクでの大規模DAMの一般化パフォーマンスに関する研究が欠落しています。この作業では、DAMを興味深い実世界のアプリケーション(医用画像分類など)でより実用的にすることを目指しています。まず、AUCスコアの新しいマージンベースの最小-最大代理損失関数を提案します(AUC最小-最大-マージン損失または単にAUCマージン損失と呼ばれます)。大規模な確率的最適化に関して同じ利点を享受しながら、一般的に使用されるAUC二乗損失よりも堅牢です。次に、4つの困難な医用画像分類タスク、すなわち(i)多くの脅威となる疾患を特定するための胸部X線画像の分類、(ii)黒色腫を特定するための皮膚病変の画像の分類について、DAM法の広範な実証研究を実施します。 iii)乳がんスクリーニングのためのマンモグラムの分類、および(iv)腫瘍組織を識別するための顕微鏡画像の分類。私たちの研究は、提案されたDAM法が、クロスエントロピー損失を最適化するパフォーマンスを大幅に改善し、これらの医用画像分類タスクで既存のAUC二乗損失を最適化するよりも優れたパフォーマンスを達成することを示しています。具体的には、DAMメソッドは2020年8月31日のスタンフォードCheXpertコンペティションで1位を獲得しました。私たちの知る限り、これはDAMを大規模な医用画像データセットで成功させる最初の作業です。また、ベンチマークデータセットのAUC二乗損失に対する新しいAUCマージン損失の利点を実証するために、広範なアブレーション研究を実施します。提案された方法は、オープンソースのライブラリLibAUC(www.libauc.org)に実装されています。
Deep AUC Maximization (DAM) is a new paradigm for learning a deep neural network by maximizing the AUC score of the model on a dataset. Most previous works of AUC maximization focus on the perspective of optimization by designing efficient stochastic algorithms, and studies on generalization performance of large-scale DAM on difficult tasks are missing. In this work, we aim to make DAM more practical for interesting real-world applications (e.g., medical image classification). First, we propose a new margin-based min-max surrogate loss function for the AUC score (named as AUC min-max-margin loss or simply AUC margin loss for short). It is more robust than the commonly used AUC square loss, while enjoying the same advantage in terms of large-scale stochastic optimization. Second, we conduct extensive empirical studies of our DAM method on four difficult medical image classification tasks, namely (i) classification of chest x-ray images for identifying many threatening diseases, (ii) classification of images of skin lesions for identifying melanoma, (iii) classification of mammogram for breast cancer screening, and (iv) classification of microscopic images for identifying tumor tissue. Our studies demonstrate that the proposed DAM method improves the performance of optimizing cross-entropy loss by a large margin, and also achieves better performance than optimizing the existing AUC square loss on these medical image classification tasks. Specifically, our DAM method has achieved the 1st place on Stanford CheXpert competition on Aug. 31, 2020. To the best of our knowledge, this is the first work that makes DAM succeed on large-scale medical image datasets. We also conduct extensive ablation studies to demonstrate the advantages of the new AUC margin loss over the AUC square loss on benchmark datasets. The proposed method is implemented in our open-sourced library LibAUC (www.libauc.org).
updated: Tue Sep 07 2021 19:18:12 GMT+0000 (UTC)
published: Sun Dec 06 2020 03:41:51 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト