教師あり深層学習ベースの方法により、医療画像のセグメンテーションに対して正確な結果が得られます。ただし、これには大きなラベル付きデータセットが必要であり、それらを取得することは、臨床の専門知識を必要とする骨の折れる作業です。半/自己監視学習ベースのアプローチは、限定された注釈付きデータとともにラベルなしデータを活用することにより、この制限に対処します。最近の教師あり学習方法では、対照的な損失を使用して、ラベルのない画像から優れたグローバルレベルの表現を学習し、ImageNetなどの一般的な自然画像データセットの分類タスクで高いパフォーマンスを実現します。セグメンテーションなどのピクセルレベルの予測タスクでは、精度を高めるために、グローバル表現とともに優れたローカルレベル表現を学習することも重要です。ただし、既存のローカル対照損失ベースの方法の影響は、ランダムな拡張と空間的近接性に基づいて類似および非類似のローカル領域が定義されるため、優れたローカル表現を学習するために制限されたままです。半/自己監視設定では大規模なエキスパート注釈がないため、ローカル領域のセマンティックラベルに基づいていません。この論文では、限定された注釈付き画像と一緒にラベルなし画像の疑似ラベルから得られたセマンティックラベル情報を活用することにより、セグメンテーションに役立つ優れたピクセルレベルの特徴を学習するための局所対照損失を提案します。特に、データセット内の異なる疑似ラベル/ラベルを持つピクセルの表現とは異なり、同じ疑似ラベル/ラベルを持つピクセルの同様の表現を促進するために提案された損失を定義します。疑似ラベルベースの自己トレーニングを実行し、ラベル付きセットとラベルなしセットの両方で提案された対照損失と、限定されたラベル付きセットのみでセグメンテーション損失を共同で最適化することにより、ネットワークをトレーニングします。 3つの公開された心臓と前立腺のデータセットで評価し、高いセグメンテーションパフォーマンスを取得しました。
Supervised deep learning-based methods yield accurate results for medical image segmentation. However, they require large labeled datasets for this, and obtaining them is a laborious task that requires clinical expertise. Semi/self-supervised learning-based approaches address this limitation by exploiting unlabeled data along with limited annotated data. Recent self-supervised learning methods use contrastive loss to learn good global level representations from unlabeled images and achieve high performance in classification tasks on popular natural image datasets like ImageNet. In pixel-level prediction tasks such as segmentation, it is crucial to also learn good local level representations along with global representations to achieve better accuracy. However, the impact of the existing local contrastive loss-based methods remains limited for learning good local representations because similar and dissimilar local regions are defined based on random augmentations and spatial proximity; not based on the semantic label of local regions due to lack of large-scale expert annotations in the semi/self-supervised setting. In this paper, we propose a local contrastive loss to learn good pixel level features useful for segmentation by exploiting semantic label information obtained from pseudo-labels of unlabeled images alongside limited annotated images. In particular, we define the proposed loss to encourage similar representations for the pixels that have the same pseudo-label/ label while being dissimilar to the representation of pixels with different pseudo-label/label in the dataset. We perform pseudo-label based self-training and train the network by jointly optimizing the proposed contrastive loss on both labeled and unlabeled sets and segmentation loss on only the limited labeled set. We evaluated on three public cardiac and prostate datasets, and obtain high segmentation performance.