arXiv reaDer
不確実性が修正されたピラミッドの一貫性を介した半教師ありセグメンテーションとその鼻咽頭癌の総標的体積への応用
Semi-supervised Segmentation via Uncertainty Rectified Pyramid Consistency and Its Application to Gross Target Volume of Nasopharyngeal Carcinoma
グロスターゲットボリューム(GTV)のセグメンテーションは、鼻咽頭癌(NPC)の放射線治療計画においてかけがえのない役割を果たします。畳み込みニューラルネットワーク(CNN)はこのタスクで優れたパフォーマンスを実現していますが、トレーニングにはラベル付き画像の大規模なセットに依存しており、取得に費用と時間がかかります。最近、ラベル付き画像の小さなセットとラベルなし画像の大きなセットから学習する半教師あり方法がこの問題に対処する可能性を示していますが、ラベル付きデータの数が限られている高性能モデルをトレーニングすることは依然として困難です。 。この論文では、半教師ありNPC GTVセグメンテーションのための不確実性修正ピラミッド整合性(URPC)正則化を備えた新しいフレームワークを提案します。具体的には、バックボーンセグメンテーションネットワークを拡張して、さまざまなスケールでピラミッド予測を生成します。ピラミッド予測ネットワーク(PPNet)は、ラベル付き画像のグラウンドトゥルースと、ラベルなし画像のマルチスケール整合性損失によって監視されていました。同じ入力の異なるスケールは、類似していて一貫している必要があります。ただし、これらの予測の解像度が異なるため、各ピクセルで直接一貫性を保つように促すことは堅牢ではなく、多くのノイズをもたらし、パフォーマンスの低下につながる可能性があります。このジレンマに対処するために、フレームワークがさまざまなスケールで意味のある信頼できる合意領域から徐々に学習できるように、新しい不確実性修正モジュールをさらに設計します。 258ボリュームの収集されたNPCデータセットでの広範な実験は、この方法がラベルなしデータを組み込むことでパフォーマンスを大幅に改善できることを示しています。このフレームワークは、平均DSCの81.22%と1.88ボクセルを達成する既存の半教師あり方法と比較して有望な結果を達成します。テストセットの平均ASD。トレーニングセットの20%のみに注釈が付けられています。
Gross Target Volume (GTV) segmentation plays an irreplaceable role in radiotherapy planning for Nasopharyngeal Carcinoma (NPC). Despite that convolutional neural networks (CNN) have achieved good performance for this task, they rely on a large set of labeled images for training, which is expensive and time-consuming to acquire. Recently, semi-supervised methods that learn from a small set of labeled images with a large set of unlabeled images have shown potential for dealing with this problem, but it is still challenging to train a high-performance model with the limited number of labeled data. In this paper, we propose a novel framework with Uncertainty Rectified Pyramid Consistency (URPC) regularization for semi-supervised NPC GTV segmentation. Concretely, we extend a backbone segmentation network to produce pyramid predictions at different scales, the pyramid predictions network (PPNet) was supervised by the ground truth of labeled images and a multi-scale consistency loss for unlabeled images, motivated by the fact that prediction at different scales for the same input should be similar and consistent. However, due to the different resolution of these predictions, encouraging them to be consistent at each pixel directly is not robust and may bring much noise and lead to a performance drop. To deal with this dilemma, we further design a novel uncertainty rectifying module to enable the framework to gradually learn from meaningful and reliable consensual regions at different scales. Extensive experiments on our collected NPC dataset with 258 volumes show that our method can largely improve performance by incorporating the unlabeled data, and this framework achieves a promising result compared with existing semi-supervised methods, which achieves 81.22% of mean DSC and 1.88 voxels of mean ASD on the test set, where the only 20% of the training set were annotated.
updated: Sun Dec 13 2020 11:45:00 GMT+0000 (UTC)
published: Sun Dec 13 2020 11:45:00 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト