arXiv reaDer
半教師付き腹部臓器セグメンテーションのためのセルフ トレーニングとハイブリッド アーキテクチャの組み合わせ
Combining Self-Training and Hybrid Architecture for Semi-supervised Abdominal Organ Segmentation
腹部臓器のセグメンテーションには、臓器の定量化、手術計画、病気の診断など、多くの重要な臨床応用があります。ただし、CT スキャンから手動で臓器に注釈を付けるには、時間と労力がかかります。半教師あり学習は、ラベルのない画像の大規模なセットと限られたラベルの付いたサンプルから学習することで、この課題を軽減する可能性を示しています。この作業では、自己トレーニング戦略に従い、教師モデルに CNN と Swin Transformer で構成される高性能ハイブリッド アーキテクチャ (PHTrans) を採用して、ラベルのないデータの正確な疑似ラベルを生成します。その後、効率性を維持しながらモデルのパフォーマンスと一般化能力を向上させるためのトレーニングのために、軽量の PHTrans を使用して 2 段階のセグメンテーション フレームワークにラベル付けされたデータと共にそれらを導入します。 FLARE2022 の検証セットに関する実験は、私たちの方法が優れたセグメンテーション パフォーマンスと高速で低リソースのモデル推論を達成することを示しています。平均 DSC と NSD は、それぞれ 0.8956 と 0.9316 です。私たちの開発環境では、平均推論時間は 18.62 秒、平均最大 GPU メモリは 1995.04 MB、GPU メモリ時間曲線の下の領域と CPU 使用率曲線の下の平均領域は 23196.84 と 319.67 です。コードは https://github.com/lseventeen/FLARE22-TwoStagePHTrans で入手できます。
Abdominal organ segmentation has many important clinical applications, such as organ quantification, surgical planning, and disease diagnosis. However, manually annotating organs from CT scans is time-consuming and labor-intensive. Semi-supervised learning has shown the potential to alleviate this challenge by learning from a large set of unlabeled images and limited labeled samples. In this work, we follow the self-training strategy and employ a high-performance hybrid architecture (PHTrans) consisting of CNN and Swin Transformer for the teacher model to generate precise pseudo labels for unlabeled data. Afterward, we introduce them with labeled data together into a two-stage segmentation framework with lightweight PHTrans for training to improve the performance and generalization ability of the model while remaining efficient. Experiments on the validation set of FLARE2022 demonstrate that our method achieves excellent segmentation performance as well as fast and low-resource model inference. The average DSC and NSD are 0.8956 and 0.9316, respectively. Under our development environments, the average inference time is 18.62 s, the average maximum GPU memory is 1995.04 MB, and the area under the GPU memory-time curve and the average area under the CPU utilization-time curve are 23196.84 and 319.67. The code is available at https://github.com/lseventeen/FLARE22-TwoStagePHTrans.
updated: Tue Oct 18 2022 08:33:22 GMT+0000 (UTC)
published: Sat Jul 23 2022 13:02:43 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト