An interpretable imbalanced semi-supervised deep learning framework for improving differential diagnosis of skin diseases
皮膚疾患は、世界中で最も一般的な疾患の 1 つです。この論文では、10,857 個のラベルのないサンプルを含む 58,457 個の皮膚画像を使用した、マルチクラス インテリジェント スキン診断フレームワーク (ISDL) の解釈可能性と不均衡な半教師あり学習に関する最初の研究を紹介します。少数派クラスからの疑似ラベル付きサンプルは、クラス再調整セルフトレーニングの各反復でより高い確率を持ち、それによってクラスの不均衡問題を解決するためのラベルなしサンプルの利用を促進します。 ISDL は、精度 0.979、感度 0.975、特異度 0.973、マクロ F1 スコア 0.974、マルチラベル皮膚疾患分類の受信者動作特性曲線 (AUC) 下面積 0.999 という有望な性能を達成しました。 Shapley 加法説明 (SHAP) メソッドを ISDL と組み合わせて、ディープ ラーニング モデルがどのように予測を行うかを説明します。この発見は、臨床診断と一致しています。また、ISDLplusを使用して、より効果的な方法で疑似ラベル付きサンプルを選択するためのサンプリング分布最適化戦略も提案しました。さらに、専門医へのプレッシャーを軽減するだけでなく、地方での専門医の不足に関連する現実的な問題にも役立つ可能性があります。
Dermatological diseases are among the most common disorders worldwide. This paper presents the first study of the interpretability and imbalanced semi-supervised learning of the multiclass intelligent skin diagnosis framework (ISDL) using 58,457 skin images with 10,857 unlabeled samples. Pseudo-labelled samples from minority classes have a higher probability at each iteration of class-rebalancing self-training, thereby promoting the utilization of unlabeled samples to solve the class imbalance problem. Our ISDL achieved a promising performance with an accuracy of 0.979, sensitivity of 0.975, specificity of 0.973, macro-F1 score of 0.974 and area under the receiver operating characteristic curve (AUC) of 0.999 for multi-label skin disease classification. The Shapley Additive explanation (SHAP) method is combined with our ISDL to explain how the deep learning model makes predictions. This finding is consistent with the clinical diagnosis. We also proposed a sampling distribution optimisation strategy to select pseudo-labelled samples in a more effective manner using ISDLplus. Furthermore, it has the potential to relieve the pressure placed on professional doctors, as well as help with practical issues associated with a shortage of such doctors in rural areas.
updated: Mon Jun 10 2024 14:28:18 GMT+0000 (UTC)
published: Sun Nov 20 2022 03:33:33 GMT+0000 (UTC)
