arXiv reaDer
組織病理学データセットを使用した不変学習のための最適輸送を使用したドメイン適応
Domain adaptation using optimal transport for invariant learning using histopathology datasets
組織病理学は、がんを含む多くの疾患の診断に不可欠です。これらのプロトコルでは、通常、病理学者が顕微鏡下でスライドを手動で評価する必要がありますが、これは時間がかかり、主観的であり、分析を自動化するための機械学習への関心につながります。ただし、計算技術はバッチ効果によって制限されます。バッチ効果では、準備プロトコルやスキャナーの違いなどの技術的要因がスライドの外観を変更し、ある機関でトレーニングされたモデルを他の機関に一般化するときに失敗する可能性があります。ここでは、ラベルやこれらの新しい設定での再トレーニングを必要とせずに、目に見えない機関からのデータへの組織病理学的モデルの一般化を改善するドメイン適応方法を提案します。私たちのアプローチは、異なる機関からの画像を表現空間で区別できる場合にモデルにペナルティを課す敵対的な方法を拡張する最適輸送(OT)損失を導入します。単一のサンプルで動作する以前の方法とは異なり、損失は画像のバッチ間の分布の違いを説明します。 Camelyon17 データセットでは、どちらの方法も色分布のグローバルな違いに適応できますが、トレーニング中に見えない癌の表現型を確実に分類できるのは OT 損失だけであることを示しています。一緒に、私たちの結果は、OT が、スライドの全タイルとバリエーションのほんの一部を構成する可能性がある、まれではあるが重要な表現型の一般化を改善することを示唆しています。
Histopathology is critical for the diagnosis of many diseases, including cancer. These protocols typically require pathologists to manually evaluate slides under a microscope, which is time-consuming and subjective, leading to interest in machine learning to automate analysis. However, computational techniques are limited by batch effects, where technical factors like differences in preparation protocol or scanners can alter the appearance of slides, causing models trained on one institution to fail when generalizing to others. Here, we propose a domain adaptation method that improves the generalization of histopathological models to data from unseen institutions, without the need for labels or retraining in these new settings. Our approach introduces an optimal transport (OT) loss, that extends adversarial methods that penalize models if images from different institutions can be distinguished in their representation space. Unlike previous methods, which operate on single samples, our loss accounts for distributional differences between batches of images. We show that on the Camelyon17 dataset, while both methods can adapt to global differences in color distribution, only our OT loss can reliably classify a cancer phenotype unseen during training. Together, our results suggest that OT improves generalization on rare but critical phenotypes that may only make up a small fraction of the total tiles and variation in a slide.
updated: Fri Mar 03 2023 22:19:19 GMT+0000 (UTC)
published: Fri Mar 03 2023 22:19:19 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト