小さな病理オブジェクトの分類と区別は、トレーニング、専門知識、および時間の経過に伴う一貫性の違いにより、人間の評価者によって大きく異なる場合があります。放射線設定では、オブジェクトは一般にクラス内の外観のばらつきが大きく、異なるクラス間で特定の特性を共有しているため、区別がさらに難しくなります。例として、拡大血管周囲腔(EPVS)やラクーンなどの脳小血管疾患のマーカーは、クラス間で高い類似性を示しながら外観が非常に変化する可能性があるため、このタスクは人間の評価者にとって非常に困難です。この作業では、深層学習環境における個々の評価者の行動とマルチ評価者のコンセンサスの共同モデルを調査し、脳病変オブジェクト検出タスクに適用します。結果は、コンセンサスラベルを直接予測する場合と比較して、個人とコンセンサスの両方の推定値を一緒にモデル化すると、パフォーマンスが大幅に向上すると同時に、人間と評価者の一貫性を評価できることを示しています。
Classification and differentiation of small pathological objects may greatly vary among human raters due to differences in training, expertise and their consistency over time. In a radiological setting, objects commonly have high within-class appearance variability whilst sharing certain characteristics across different classes, making their distinction even more difficult. As an example, markers of cerebral small vessel disease, such as enlarged perivascular spaces (EPVS) and lacunes, can be very varied in their appearance while exhibiting high inter-class similarity, making this task highly challenging for human raters. In this work, we investigate joint models of individual rater behaviour and multirater consensus in a deep learning setting, and apply it to a brain lesion object-detection task. Results show that jointly modelling both individual and consensus estimates leads to significant improvements in performance when compared to directly predicting consensus labels, while also allowing the characterization of human-rater consistency.