ターゲットラベルにノイズが多い場合に、医療画像セグメンテーションで最も一般的な2つのパフォーマンスメトリックであるAccuracyとDiceを調査します。両方のメトリックについて、最適なセグメンテーションのセットの特性評価とボリュームプロパティに関連するいくつかのステートメントが証明され、関連する実験が提供されます。私たちの主な洞察は次のとおりです。(i)両方のメトリックに対するソリューションの量は、ターゲットの予想される量から大幅に逸脱する可能性があります。(ii)精度に対するソリューションの量は、常に次のようなソリューションの量以下です。ダイスと(iii)これらのメトリックの両方に対する最適なソリューションは、実行可能なセグメンテーションのセットが、ターゲットの予想ボリュームに等しいボリュームを持つセグメンテーションのセットに制約されている場合に一致します。
We study two of the most popular performance metrics in medical image segmentation, Accuracy and Dice, when the target labels are noisy. For both metrics, several statements related to characterization and volume properties of the set of optimal segmentations are proved, and associated experiments are provided. Our main insights are: (i) the volume of the solutions to both metrics may deviate significantly from the expected volume of the target, (ii) the volume of a solution to Accuracy is always less than or equal to the volume of a solution to Dice and (iii) the optimal solutions to both of these metrics coincide when the set of feasible segmentations is constrained to the set of segmentations with the volume equal to the expected volume of the target.