医療画像のセグメンテーションには通常、大規模で正確に注釈が付けられたデータセットが必要です。ただし、ピクセル単位のアノテーションの取得は、専門分野の専門家による多大な労力を必要とする多大な労力を必要とする作業であり、実際の臨床シナリオで取得するのは困難です。このような状況では、必要なアノテーションの量を減らすことがより現実的なアプローチです。実現可能な方向の 1 つはスパース アノテーションです。これは、少数のスライスのみにアノテーションを付けることを含み、正確な境界を保持するため、バウンディング ボックスや落書きなどの従来の弱いアノテーション方法に比べていくつかの利点があります。ただし、監視信号が不足しているため、まばらなアノテーションから学習することは困難です。この問題に対処するために、3D ネットワークと 2D ネットワークの両方のクロスティーチングを使用して、スパースなアノテーションから確実に学習できるフレームワークを提案します。これらのネットワークの特性を考慮して、ハード/ソフト信頼しきい値と一貫したラベル融合という 2 つの擬似ラベル選択戦略を開発します。 MMWHS データセットでの実験結果は、私たちの方法が最先端 (SOTA) 半教師ありセグメンテーション方法よりも優れていることを示しています。さらに、私たちのアプローチは、完全に監視された上限の結果に匹敵する結果を達成します。
Medical image segmentation typically necessitates a large and precisely annotated dataset. However, obtaining pixel-wise annotation is a labor-intensive task that requires significant effort from domain experts, making it challenging to obtain in practical clinical scenarios. In such situations, reducing the amount of annotation required is a more practical approach. One feasible direction is sparse annotation, which involves annotating only a few slices, and has several advantages over traditional weak annotation methods such as bounding boxes and scribbles, as it preserves exact boundaries. However, learning from sparse annotation is challenging due to the scarcity of supervision signals. To address this issue, we propose a framework that can robustly learn from sparse annotation using the cross-teaching of both 3D and 2D networks. Considering the characteristic of these networks, we develop two pseudo label selection strategies, which are hard-soft confidence threshold and consistent label fusion. Our experimental results on the MMWHS dataset demonstrate that our method outperforms the state-of-the-art (SOTA) semi-supervised segmentation methods. Moreover, our approach achieves results that are comparable to the fully-supervised upper bound result.