医療画像セグメンテーションモデルは、通常、ピクセルレベルで専門家の注釈によって監視されますが、これは取得に費用がかかる可能性があります。この作業では、マルチラベルセマンティックセグメンテーションモデルをトレーニングするために、高品質のピクセルレベルのエキスパートアノテーションと、DNNで生成された粗い顕著性マップのスケールを組み合わせた方法を提案します。マルチラベル胸部X線解釈における、CheXsegと呼ばれる半教師あり法の適用を示します。 CheXsegは、ピクセルレベルのエキスパートアノテーションのみを使用する完全教師ありメソッドのパフォーマンス(mIoU)を9.7%向上させ、DNN生成の顕著性マップのみを使用する弱教師ありメソッドのパフォーマンス(mIoU)を73.1%向上させることがわかりました。私たちの最良の方法は、10の病状のうち3つについて放射線科医の合意に一致することができ、弱く監視された方法と比較して、全体的なパフォーマンスギャップを57.2%削減します。
Medical image segmentation models are typically supervised by expert annotations at the pixel-level, which can be expensive to acquire. In this work, we propose a method that combines the high quality of pixel-level expert annotations with the scale of coarse DNN-generated saliency maps for training multi-label semantic segmentation models. We demonstrate the application of our semi-supervised method, which we call CheXseg, on multi-label chest X-ray interpretation. We find that CheXseg improves upon the performance (mIoU) of fully-supervised methods that use only pixel-level expert annotations by 9.7% and weakly-supervised methods that use only DNN-generated saliency maps by 73.1%. Our best method is able to match radiologist agreement on three out of ten pathologies and reduces the overall performance gap by 57.2% as compared to weakly-supervised methods.