On Modelling Label Uncertainty in Deep Neural Networks: Automatic Estimation of Intra-observer Variability in 2D Echocardiography Quality Assessment
 観察者内の変動に起因する臨床データのラベルの不確実性は、ディープニューラルネットワークによって行われた評価の信頼性に直接影響を与える可能性があります。本論文では、ポイントオブケアで心血管疾患を検出するための日常的な手順である2D心エコー検査(エコー)のコンテキストでこのような不確実性をモデル化する方法を提案します。エコーイメージングの品質と取得時間は、オペレーターの経験レベルに大きく依存します。最近の開発により、ディープラーニング技術により、専門家の品質評価をエコー画像にマッピングすることにより、エコー画像品質の定量化を自動化できる可能性が示されています。それにもかかわらず、専門家の評価における観察者の変動は、品質の定量化の精度に影響を与える可能性があります。ここでは、カテゴリカルラベルを使用して回帰問題を処理する新しい方法を導入して、エコー品質評価における観察者内変動を偶発的不確実性モデリング回帰問題としてモデル化することを目指しています。この設計の重要な特徴は、ネットワーク出力の不確実性のレベルを推定するのに単一のフォワードパスだけで十分であることです。従来の回帰法によってアーカイブされた0.11±0.09絶対誤差(0から1のスケール)と比較して、提案された方法は誤差を0.09±0.08に下げます。ここで、改善は統計的に有意であり、テスト精度5.7% 。提案されたアプローチの単純さは、臨床ラベルにしばしば不確実性がある医療イメージングにおける深層学習の他のアプリケーションに一般化できることを意味します。
Uncertainty of labels in clinical data resulting from intra-observer variability can have direct impact on the reliability of assessments made by deep neural networks. In this paper, we propose a method for modelling such uncertainty in the context of 2D echocardiography (echo), which is a routine procedure for detecting cardiovascular disease at point-of-care. Echo imaging quality and acquisition time is highly dependent on the operator's experience level. Recent developments have shown the possibility of automating echo image quality quantification by mapping an expert's assessment of quality to the echo image via deep learning techniques. Nevertheless, the observer variability in the expert's assessment can impact the quality quantification accuracy. Here, we aim to model the intra-observer variability in echo quality assessment as an aleatoric uncertainty modelling regression problem with the introduction of a novel method that handles the regression problem with categorical labels. A key feature of our design is that only a single forward pass is sufficient to estimate the level of uncertainty for the network output. Compared to the 0.11 ±0.09 absolute error (in a scale from 0 to 1) archived by the conventional regression method, the proposed method brings the error down to 0.09 ±0.08, where the improvement is statistically significant and equivalents to 5.7% test accuracy improvement. The simplicity of the proposed approach means that it could be generalized to other applications of deep learning in medical imaging, where there is often uncertainty in clinical labels.
