arXiv reaDer
複数の許容可能な注釈によるセグメンテーション:造影心エコー検査における心筋セグメンテーションのケーススタディ
Segmentation with Multiple Acceptable Annotations: A Case Study of Myocardial Segmentation in Contrast Echocardiography
画像セグメンテーションのためのほとんどの既存の深層学習ベースのフレームワークは、固有のグラウンドトゥルースが既知であり、パフォーマンス評価に使用できることを前提としています。これは多くのアプリケーションに当てはまりますが、すべてではありません。自動心筋灌流分析の重要なタスクである心筋コントラスト心エコー検査(MCE)の心筋セグメンテーションがその一例です。 MCEデータの解像度が低く、重大なアーティファクトがあるため、さまざまな心臓専門医からの注釈が大幅に異なる可能性があり、どれが最適かを判断するのは困難です。この場合、セグメンテーションのパフォーマンスを評価するための良い方法をどのように見つけることができ、ニューラルネットワークをどのようにトレーニングすることができますか?この論文では、複数の受け入れられたグラウンドトゥルースが利用可能な場合にセグメンテーションパフォーマンスを効果的に評価するための新しい拡張ダイスを提案することにより、最初の問題に対処します。次に、提案されたメトリックに基づいて、ニューラルネットワークが心筋の一般的な特徴を柔軟に学習できるようにする損失関数に新しいメトリックをさらに組み込むことによって、2番目の問題を解決します。私たちの臨床MCEデータセットの実験結果は、提案された損失関数でトレーニングされたニューラルネットワークが、定量的および定性的に、複数の注釈から一意のグラウンドトゥルースを取得しようとする既存のニューラルネットワークよりも優れていることを示しています。最後に、私たちの評価研究は、評価メトリックとして拡張ダイスを使用すると、ダイスを使用する場合と比較して、手動修正が必要なセグメンテーション結果をより適切に識別できることを示しています。
Most existing deep learning-based frameworks for image segmentation assume that a unique ground truth is known and can be used for performance evaluation. This is true for many applications, but not all. Myocardial segmentation of Myocardial Contrast Echocardiography (MCE), a critical task in automatic myocardial perfusion analysis, is an example. Due to the low resolution and serious artifacts in MCE data, annotations from different cardiologists can vary significantly, and it is hard to tell which one is the best. In this case, how can we find a good way to evaluate segmentation performance and how do we train the neural network? In this paper, we address the first problem by proposing a new extended Dice to effectively evaluate the segmentation performance when multiple accepted ground truth is available. Then based on our proposed metric, we solve the second problem by further incorporating the new metric into a loss function that enables neural networks to flexibly learn general features of myocardium. Experiment results on our clinical MCE data set demonstrate that the neural network trained with the proposed loss function outperforms those existing ones that try to obtain a unique ground truth from multiple annotations, both quantitatively and qualitatively. Finally, our grading study shows that using extended Dice as an evaluation metric can better identify segmentation results that need manual correction compared with using Dice.
updated: Tue Jun 29 2021 17:32:24 GMT+0000 (UTC)
published: Tue Jun 29 2021 17:32:24 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト