対照学習は、現代の教師あり学習の重要な手法です。以前のアプローチのより広いアクセス可能性は、大規模な負のサンプルまたは勢いに対応する重い計算リソース(たとえば、少なくとも8GPUまたは32TPUコア)の必要性によって妨げられています。より最近のSimSiamアプローチは、運動量エンコーダーのないストップグラジエントを介してこのような重要な制限に対処します。医療画像分析では、同じ患者または組織から複数のインスタンスを取得できます。これらの進歩に触発されて、病理画像に対する単純なトリプレット表現学習(SimTriplet)アプローチを提案します。この論文の貢献は3つあります。(1)提案されたSimTripletメソッドは、自己増強を超えた医用画像のマルチビューの性質を利用します。 (2)このメソッドは、負のサンプルを使用せずに、正のペアからのトリプレットを介してサンプル内とサンプル間の両方の類似性を最大化します。 (3)最近のミックスプレシジョントレーニングは、16GBのメモリを備えた単一のGPUのみを使用してトレーニングを進めるために採用されています。 SimTripletは、79,000のラベルなしの病理学的パッチ画像から学習することにより、教師あり学習と比較して10.58%優れたパフォーマンスを達成しました。また、SimSiamと比較して2.13%優れたパフォーマンスを達成しました。私たちが提案するSimTripletは、わずか1%のラベル付きデータを使用して適切なパフォーマンスを実現できます。コードとデータはhttps://github.com/hrlblab/SimTripleで入手できます。
Contrastive learning is a key technique of modern self-supervised learning. The broader accessibility of earlier approaches is hindered by the need of heavy computational resources (e.g., at least 8 GPUs or 32 TPU cores), which accommodate for large-scale negative samples or momentum. The more recent SimSiam approach addresses such key limitations via stop-gradient without momentum encoders. In medical image analysis, multiple instances can be achieved from the same patient or tissue. Inspired by these advances, we propose a simple triplet representation learning (SimTriplet) approach on pathological images. The contribution of the paper is three-fold: (1) The proposed SimTriplet method takes advantage of the multi-view nature of medical images beyond self-augmentation; (2) The method maximizes both intra-sample and inter-sample similarities via triplets from positive pairs, without using negative samples; and (3) The recent mix precision training is employed to advance the training by only using a single GPU with 16GB memory. By learning from 79,000 unlabeled pathological patch images, SimTriplet achieved 10.58% better performance compared with supervised learning. It also achieved 2.13% better performance compared with SimSiam. Our proposed SimTriplet can achieve decent performance using only 1% labeled data. The code and data are available at https://github.com/hrlblab/SimTriple.