核の自動セグメンテーションと分類は、デジタル病理学において不可欠なタスクです。現在の深層学習ベースのアプローチでは、病理学者による膨大な量の注釈付きデータセットが必要です。ただし、既存のデータセットは一般にさまざまな種類の核の間で不均衡であり、パフォーマンスが大幅に低下します。この論文では、核のセグメンテーションと分類用に特別に設計された、GradMix と呼ばれるシンプルだが効果的なデータ拡張手法を提案します。 GradMix は、メジャー クラスの核とレア クラスの核のペアを取り、カスタマイズされた混合マスクを作成し、マスクを使用してそれらを結合し、新しいレア クラスの核を生成します。 2 つの核を結合するので、GradMix は、カスタマイズされたミキシング マスクを使用して、核と隣接する環境の両方を考慮します。これにより、さまざまな環境で現実的なレアクラスの核を生成できます。 GradMix の有効性を評価するために、2 つのデータセットを使用しました。実験結果は、GradMix が、不均衡な病理画像データセットにおける核のセグメンテーションと分類のパフォーマンスを改善できることを示唆しています。
An automated segmentation and classification of nuclei is an essential task in digital pathology. The current deep learning-based approaches require a vast amount of annotated datasets by pathologists. However, the existing datasets are imbalanced among different types of nuclei in general, leading to a substantial performance degradation. In this paper, we propose a simple but effective data augmentation technique, termed GradMix, that is specifically designed for nuclei segmentation and classification. GradMix takes a pair of a major-class nucleus and a rare-class nucleus, creates a customized mixing mask, and combines them using the mask to generate a new rare-class nucleus. As it combines two nuclei, GradMix considers both nuclei and the neighboring environment by using the customized mixing mask. This allows us to generate realistic rare-class nuclei with varying environments. We employed two datasets to evaluate the effectiveness of GradMix. The experimental results suggest that GradMix is able to improve the performance of nuclei segmentation and classification in imbalanced pathology image datasets.