arXiv reaDer
胸部X線撮影による肺結核の検出のための深層学習:10カ国にわたる国際研究
Deep learning for detecting pulmonary tuberculosis via chest radiography: an international study across 10 countries
結核(TB)は、世界の死因のトップ10です。 WHOは結核スクリーニングに胸部X線写真(CXR)を推奨していますが、CXR解釈の利用可能性が限られていることが障壁となっています。アフリカ、アジア、ヨーロッパの9か国のCXRを使用して活動性肺結核を検出する深層学習システム(DLS)をトレーニングし、大規模なCXR事前トレーニング、注意のプーリング、および騒々しい学生の半教師あり学習を利用しました。評価は、(1)中国、インド、米国、ザンビアにまたがる複合テストセット、および(2)南アフリカの独立した鉱業人口について行われました。 90%の感度と70%の特異性というWHOの目標を考えると、DLSの動作点は、特異性よりも感度を優先するように事前に指定されています。組み合わせたテストセットでは、DLSのROC曲線は、インドを拠点とする9人の放射線科医すべてを上回り、AUCは0.90(95%CI 0.87-0.92)でした。 DLSの感度(88%)は、インドを拠点とする放射線科医(75%の平均感度)よりも高く、優越性についてはp <0.001でした。その特異度(79%)は放射線科医に劣っていませんでした(84%の平均特異度)、p = 0.004。同様の傾向が、HIV陽性および喀痰塗抹陽性のサブグループ内、および南アフリカのテストセットで観察されました。米国を拠点とする5人の放射線科医(結核が流行していない)は、インドを拠点とする放射線科医(結核が流行している)よりも感度が高く、特異性が低いことがわかりました。 DLSはまた、米国を拠点とする放射線科医に対して劣っていませんでした。シミュレーションでは、確認テストの優先順位付けツールとしてDLSを使用すると、確認テストのみを使用した場合と比較して、検出された陽性症例あたりのコストが40〜80%削減されました。結論として、私たちのDLSは5か国に一般化されており、放射線技師が限られた環境で費用効果の高いスクリーニングの取り組みを支援するための前向き評価に値します。動作点の柔軟性により、結核の有病率、人口統計、臨床リソース、慣習的な診療パターンなどのサイト固有の要因を考慮してDLSをカスタマイズできる場合があります。
Tuberculosis (TB) is a top-10 cause of death worldwide. Though the WHO recommends chest radiographs (CXRs) for TB screening, the limited availability of CXR interpretation is a barrier. We trained a deep learning system (DLS) to detect active pulmonary TB using CXRs from 9 countries across Africa, Asia, and Europe, and utilized large-scale CXR pretraining, attention pooling, and noisy student semi-supervised learning. Evaluation was on (1) a combined test set spanning China, India, US, and Zambia, and (2) an independent mining population in South Africa. Given WHO targets of 90% sensitivity and 70% specificity, the DLS's operating point was prespecified to favor sensitivity over specificity. On the combined test set, the DLS's ROC curve was above all 9 India-based radiologists, with an AUC of 0.90 (95%CI 0.87-0.92). The DLS's sensitivity (88%) was higher than the India-based radiologists (75% mean sensitivity), p<0.001 for superiority; and its specificity (79%) was non-inferior to the radiologists (84% mean specificity), p=0.004. Similar trends were observed within HIV positive and sputum smear positive sub-groups, and in the South Africa test set. We found that 5 US-based radiologists (where TB isn't endemic) were more sensitive and less specific than the India-based radiologists (where TB is endemic). The DLS also remained non-inferior to the US-based radiologists. In simulations, using the DLS as a prioritization tool for confirmatory testing reduced the cost per positive case detected by 40-80% compared to using confirmatory testing alone. To conclude, our DLS generalized to 5 countries, and merits prospective evaluation to assist cost-effective screening efforts in radiologist-limited settings. Operating point flexibility may permit customization of the DLS to account for site-specific factors such as TB prevalence, demographics, clinical resources, and customary practice patterns.
updated: Sun May 16 2021 22:56:06 GMT+0000 (UTC)
published: Sun May 16 2021 22:56:06 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト