Self-Supervised Similarity Learning for Digital Pathology
 ImageNetで事前にトレーニングされたネットワークから抽出された機能を使用することは、デジタル病理学のディープラーニングのアプリケーションにおける一般的なプラクティスです。ただし、ドメイン固有の画像情報がないという欠点があります。デジタル病理学では、教師ありトレーニングデータは高価で収集が困難です。実装が簡単で、堅牢でコンパクトな画像記述子の作成を可能にする、スライド全体の類似性学習(WSI)による特徴抽出のための自己監視方式を提案します。シャムネットワークを訓練し、画像の空間的連続性を活用し、画像内の空間的に隣接するタイルは、遠くのタイルよりも互いに類似していると仮定します。当社のネットワーク出力は、長さ128の機能ベクトルを備えており、ImageNetで事前にトレーニングされたネットワークよりも大幅に少ないメモリストレージと高速な処理を可能にします。 Camelyon16トレインセットのデジタル病理WSIにメソッドを適用し、Camelyon16テストセットの腫瘍タイルの画像検索と遠く/近くのタイルの記述子ペアの距離比を測定することにより、この方法を評価および比較します。この方法は、既存のImageNetベースの一般的な自己監視型特徴抽出方法よりも優れた検索タスク結果をもたらすことを示しています。私たちの知る限り、これはデジタル病理学に合わせた自己教師付き学習のための最初の公開された方法でもあります。
Using features extracted from networks pretrained on ImageNet is a common practice in applications of deep learning for digital pathology. However it presents the downside of missing domain specific image information. In digital pathology, supervised training data is expensive and difficult to collect. We propose a self-supervised method for feature extraction by similarity learning on whole slide images (WSI) that is simple to implement and allows creation of robust and compact image descriptors. We train a siamese network, exploiting image spatial continuity and assuming spatially adjacent tiles in the image are more similar to each other than distant tiles. Our network outputs feature vectors of length 128, which allows dramatically lower memory storage and faster processing than networks pretrained on ImageNet. We apply the method on digital pathology WSIs from the Camelyon16 train set and assess and compare our method by measuring image retrieval of tumor tiles and descriptor pair distance ratio for distant/near tiles in the Camelyon16 test set. We show that our method yields better retrieval task results than existing ImageNet based and generic self-supervised feature extraction methods. To the best of our knowledge, this is also the first published method for self-supervised learning tailored for digital pathology.
updated: Mon Jan 13 2020 11:20:38 GMT+0000 (UTC)
published: Mon May 20 2019 14:31:26 GMT+0000 (UTC)
