arXiv reaDer
病理学における機械学習モデルの評価の再考
Rethinking Machine Learning Model Evaluation in Pathology
機械学習は、研究および臨床診療における病理画像に適用されており、有望な成果が得られています。ただし、標準のMLモデルには、臨床上の決定に必要な厳密な評価が欠けていることがよくあります。自然画像の機械学習技術は、非常に大きくてノイズが多く、高価なラベル付けが必要で、解釈が難しく、疑似相関の影響を受けやすい病理画像を処理するための設備が整っていません。上記の懸念に対処する病理学におけるML評価のための一連の実用的なガイドラインを提案します。このペーパーには、評価フレームワークを設定し、ラベルの変動に効果的に対処するための手段と、ドメインシフト、堅牢性、および交絡変数に関連する問題に対処するための推奨される一連のテストが含まれています。提案されたフレームワークがML研究者とドメインの専門家の間のギャップを埋め、病理学におけるML技術の幅広い採用につながり、患者の転帰を改善することを願っています。
Machine Learning has been applied to pathology images in research and clinical practice with promising outcomes. However, standard ML models often lack the rigorous evaluation required for clinical decisions. Machine learning techniques for natural images are ill-equipped to deal with pathology images that are significantly large and noisy, require expensive labeling, are hard to interpret, and are susceptible to spurious correlations. We propose a set of practical guidelines for ML evaluation in pathology that address the above concerns. The paper includes measures for setting up the evaluation framework, effectively dealing with variability in labels, and a recommended suite of tests to address issues related to domain shift, robustness, and confounding variables. We hope that the proposed framework will bridge the gap between ML researchers and domain experts, leading to wider adoption of ML techniques in pathology and improving patient outcomes.
updated: Fri Apr 15 2022 16:32:52 GMT+0000 (UTC)
published: Mon Apr 11 2022 15:49:12 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト