arXiv reaDer
ノイズの多いラベルからのロバストな分類:胸部X線撮影の異常評価のための追加知識の統合
Robust Classification from Noisy Labels: Integrating Additional Knowledge for Chest Radiography Abnormality Assessment
胸部X線検査は、さまざまな心臓や肺の異常を検出するために日常の臨床診療で行われる最も一般的なX線検査です。 1人の放射線科医が1日あたり100を超える研究を行っているため、読み取って報告する大量のデータは、高い解釈精度を一貫して維持する上で課題となります。大規模な公開データセットの導入により、異常分類を自動化するための一連の新しいシステムが生まれました。ただし、これらのデータセットのラベルは、自然言語で処理された医療レポートを使用して取得されたため、パフォーマンスに影響を与える可能性のある大きなラベルノイズが発生しました。この研究では、このような次善のデータからのラベルノイズを処理する新しいトレーニング戦略を提案します。以前のラベル確率は、4人の理事会認定放射線科医によって再読されたトレーニングデータのサブセットで測定され、ラベルノイズに対するトレーニングモデルの堅牢性を高めるためにトレーニング中に使用されました。さらに、胸部X線撮影で観察された異常の高い併存疾患を利用し、この情報を組み込んでラベルノイズの影響をさらに低減します。さらに、解剖学的知識は、肺と心臓のセグメンテーション、および空間知識ラベルを予測するようにシステムをトレーニングすることによって組み込まれます。さまざまな後処理技術を適用するさまざまなスキャナーから派生した複数のデータセットと画像を処理するために、新しい画像正規化戦略を導入します。実験は、86,876人の患者からの297,541の胸部レントゲン写真の広範なコレクションで実行され、2つのデータセットからの17の異常に対する最先端のパフォーマンスレベルにつながりました。すべての異常にわたって平均AUCスコアが0.880であるため、提案されたトレーニング戦略を使用して、パフォーマンススコアを大幅に向上させることができます。
Chest radiography is the most common radiographic examination performed in daily clinical practice for the detection of various heart and lung abnormalities. The large amount of data to be read and reported, with more than 100 studies per day for a single radiologist, poses a challenge in consistently maintaining high interpretation accuracy. The introduction of large-scale public datasets has led to a series of novel systems for automated abnormality classification. However, the labels of these datasets were obtained using natural language processed medical reports, yielding a large degree of label noise that can impact the performance. In this study, we propose novel training strategies that handle label noise from such suboptimal data. Prior label probabilities were measured on a subset of training data re-read by 4 board-certified radiologists and were used during training to increase the robustness of the training model to the label noise. Furthermore, we exploit the high comorbidity of abnormalities observed in chest radiography and incorporate this information to further reduce the impact of label noise. Additionally, anatomical knowledge is incorporated by training the system to predict lung and heart segmentation, as well as spatial knowledge labels. To deal with multiple datasets and images derived from various scanners that apply different post-processing techniques, we introduce a novel image normalization strategy. Experiments were performed on an extensive collection of 297,541 chest radiographs from 86,876 patients, leading to a state-of-the-art performance level for 17 abnormalities from 2 datasets. With an average AUC score of 0.880 across all abnormalities, our proposed training strategies can be used to significantly improve performance scores.
updated: Wed Apr 21 2021 09:07:00 GMT+0000 (UTC)
published: Mon Apr 12 2021 07:51:07 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト