arXiv reaDer
階層的識別学習は、生物医学顕微鏡の視覚的表現を改善します
Hierarchical discriminative learning improves visual representations of biomedical microscopy
高品質で自己管理型の視覚的表現を学習することは、生物医学顕微鏡法と臨床医学におけるコンピューター ビジョンの役割を向上させるために不可欠です。以前の研究では、インスタンス識別のために開発された自己教師あり表現学習 (SSL) メソッドに焦点を当て、癌診断に使用されるギガピクセルの全スライド画像 (WSI) からサンプリングされた画像パッチまたは視野にそれらを直接適用しました。ただし、この戦略は、(1) 同じ患者からのパッチが独立していると仮定し、(2) 臨床生物医学顕微鏡の患者 - スライド - パッチの階層を無視し、(3) ダウンストリームのパフォーマンスを低下させる可能性のある強力なデータ増強を必要とするため、制限があります。重要なことに、患者の腫瘍の WSI からサンプリングされたパッチは、根底にある同じ癌診断を捉えた多様な画像例のセットです。これは、臨床生物医学顕微鏡法に固有の患者 - スライド - パッチ階層を活用して、基礎となる診断の特徴を暗黙的に学習する階層的な識別学習タスクを定義するデータ駆動型の方法である HiDisc を動機付けました。 HiDisc は、データ階層の共通の祖先に基づいてポジティブ パッチ ペアが定義される自己教師あり対照学習フレームワークを使用し、統合されたパッチ、スライド、および患者の識別学習目標がビジュアル SSL に使用されます。 2 つの生物医学顕微鏡データセットを使用して、2 つのビジョン タスクで HiDisc の視覚的表現をベンチマークし、(1) HiDisc の事前トレーニングが、がん診断と遺伝子変異予測のための現在の最先端の自己教師あり事前トレーニング方法よりも優れていること、および (2) HiDisc を実証します。強力なデータ拡張なしで、自然なパッチの多様性を使用して高品質の視覚的表現を学習します。
Learning high-quality, self-supervised, visual representations is essential to advance the role of computer vision in biomedical microscopy and clinical medicine. Previous work has focused on self-supervised representation learning (SSL) methods developed for instance discrimination and applied them directly to image patches, or fields-of-view, sampled from gigapixel whole-slide images (WSIs) used for cancer diagnosis. However, this strategy is limited because it (1) assumes patches from the same patient are independent, (2) neglects the patient-slide-patch hierarchy of clinical biomedical microscopy, and (3) requires strong data augmentations that can degrade downstream performance. Importantly, sampled patches from WSIs of a patient's tumor are a diverse set of image examples that capture the same underlying cancer diagnosis. This motivated HiDisc, a data-driven method that leverages the inherent patient-slide-patch hierarchy of clinical biomedical microscopy to define a hierarchical discriminative learning task that implicitly learns features of the underlying diagnosis. HiDisc uses a self-supervised contrastive learning framework in which positive patch pairs are defined based on a common ancestry in the data hierarchy, and a unified patch, slide, and patient discriminative learning objective is used for visual SSL. We benchmark HiDisc visual representations on two vision tasks using two biomedical microscopy datasets, and demonstrate that (1) HiDisc pretraining outperforms current state-of-the-art self-supervised pretraining methods for cancer diagnosis and genetic mutation prediction, and (2) HiDisc learns high-quality visual representations using natural patch diversity without strong data augmentations.
updated: Thu Mar 02 2023 22:04:42 GMT+0000 (UTC)
published: Thu Mar 02 2023 22:04:42 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト