arXiv reaDer
ドメインシフトとラベルノイズの下での病理組織画像による一般的な不確実性推定法のベンチマーク
Benchmarking common uncertainty estimation methods with histopathological images under domain shift and label noise
ここ数年、組織病理学的アプリケーションの分野でディープラーニングの使用が増加しています。ただし、これらのアプローチは大きな可能性を示していますが、高リスク環境では深層学習モデルが不確実性を判断し、誤分類の可能性が大きい場合に入力を拒否できる必要があります。この研究では、モデルが不確実な状況では分類を拒否する必要がある選択的分類のタスクに焦点を当てて、スライド画像全体の分類に最も一般的に使用される不確実性とロバスト性の手法の厳密な評価を実施します。 。実験は、スライド レベルだけでなく、ドメイン シフトとラベル ノイズの観点からタイル レベルでも実施します。私たちの実験では、ディープ アンサンブル、モンテカルロ ドロップアウト、確率的変分推論、テスト時データ拡張、および後者のアプローチのアンサンブルを比較します。一般に、一連の手法を使用すると、不確実性の推定値が向上し、ドメイン シフトやラベル ノイズに対するロバスト性が向上しますが、古典的なコンピュータ ビジョン ベンチマークの結果とは対照的に、他の手法の体系的なゲインは示されないことが観察されています。どの方法においても、最も不確実なサンプルを拒否することで、分布内データと分布外データの両方で分類精度が確実に大幅に向上します。さらに、ラベルノイズの条件を変えてこれらの手法を比較する実験を行います。最後に、組織病理学的データの不確実性推定に関するさらなる研究を促進するためのコード フレームワークを公開します。
In the past years, deep learning has seen an increase in usage in the domain of histopathological applications. However, while these approaches have shown great potential, in high-risk environments deep learning models need to be able to judge their uncertainty and be able to reject inputs when there is a significant chance of misclassification. In this work, we conduct a rigorous evaluation of the most commonly used uncertainty and robustness methods for the classification of Whole Slide Images, with a focus on the task of selective classification, where the model should reject the classification in situations in which it is uncertain. We conduct our experiments on tile-level under the aspects of domain shift and label noise, as well as on slide-level. In our experiments, we compare Deep Ensembles, Monte-Carlo Dropout, Stochastic Variational Inference, Test-Time Data Augmentation as well as ensembles of the latter approaches. We observe that ensembles of methods generally lead to better uncertainty estimates as well as an increased robustness towards domain shifts and label noise, while contrary to results from classical computer vision benchmarks no systematic gain of the other methods can be shown. Across methods, a rejection of the most uncertain samples reliably leads to a significant increase in classification accuracy on both in-distribution as well as out-of-distribution data. Furthermore, we conduct experiments comparing these methods under varying conditions of label noise. Lastly, we publish our code framework to facilitate further research on uncertainty estimation on histopathological data.
updated: Thu Jul 06 2023 10:38:54 GMT+0000 (UTC)
published: Tue Jan 03 2023 11:34:36 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト