arXiv reaDer
肝臓組織病理学のための機械学習モデルのセルフトレーニング: 臨床シフトの下での一般化
Self-training of Machine Learning Models for Liver Histopathology: Generalization under Clinical Shifts
組織病理画像はギガピクセル サイズで、さまざまな解像度の特徴と情報が含まれています。組織病理学で注釈を収集するには、高度に専門化された病理学者が必要であり、費用と時間がかかります。セルフトレーニングは、ラベル付きデータとラベルなしデータの両方から学習することで注釈の制約を緩和し、病理学者が必要とする注釈の量を減らすことができます。非アルコール性脂肪性肝炎 (NASH) の教師と生徒の自己訓練システムの設計を、注釈が限られている臨床組織病理学データセットを使用して研究します。臨床データシフトの下で、分布内および分布外のテストデータでモデルを評価します。自己トレーニングを通じて、最高の学生モデルは、マクロ F1 スコアで 3% の絶対差で教師よりも統計的に優れていることを示しています。最良の学生モデルは、2 倍のアノテーションでトレーニングされた完全に教師ありのモデルのパフォーマンスにも近づきます。
Histopathology images are gigapixel-sized and include features and information at different resolutions. Collecting annotations in histopathology requires highly specialized pathologists, making it expensive and time-consuming. Self-training can alleviate annotation constraints by learning from both labeled and unlabeled data, reducing the amount of annotations required from pathologists. We study the design of teacher-student self-training systems for Non-alcoholic Steatohepatitis (NASH) using clinical histopathology datasets with limited annotations. We evaluate the models on in-distribution and out-of-distribution test data under clinical data shifts. We demonstrate that through self-training, the best student model statistically outperforms the teacher with a 3% absolute difference on the macro F1 score. The best student model also approaches the performance of a fully supervised model trained with twice as many annotations.
updated: Mon Nov 14 2022 19:10:20 GMT+0000 (UTC)
published: Mon Nov 14 2022 19:10:20 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト