arXiv reaDer
ディープ ラーニング ベースの X 線写真診断におけるショートカットを克服するための注釈の粒度の再考: 多施設共同研究
Rethinking Annotation Granularity for Overcoming Shortcuts in Deep Learning-based Radiograph Diagnosis: A Multicenter Study
2 つの DL モデルは、それぞれ CheXNet および CheXDet と名付けられた X 線写真レベルの注釈 (病気の有無) およびきめの細かい病変レベルの注釈 (病変境界ボックス) を使用して開発されました。モデルの内部分類性能と病変位置特定性能はテスト セット (n=2,922) で比較され、外部分類性能は NIH-Google (n=4,376) と PadChest (n=24,536) データセットで比較され、外部病変位置特定性能が比較されました。 NIH-ChestX-ray14 データセット (n=880) で比較されました。モデルは、内部テスト セット (n = 496) のサブセットで放射線科医とも比較されました。十分なトレーニング データがあれば、どちらのモデルも放射線科医と同等の性能を発揮しました。 CheXDet は、NIH-Google (CheXDet ROC 曲線下面積 [AUC]: 0.67、CheXNet AUC: 0.51; p<.001) および PadChest (CheXDet AUC: 0.78、CheXNet AUC) での骨折の分類など、外部分類の大幅な改善を達成しました。 : 0.55; p<.001)。 CheXDet は、内部セットでの気胸の検出など、すべてのデータセットのほとんどの異常に対して、CheXNet よりも高い病変検出性能を達成しました (CheXDet ジャックナイフ代替自由応答 ROC 性能指数 [JAFROC-FOM]: 0.87、CheXNet JAFROC-FOM: 0.13 ; p<.001) および NIH-ChestX-ray14 (CheXDet JAFROC-FOM: 0.55、CheXNet JAFROC-FOM: 0.04; p<.001)。要約すると、きめの細かい注釈がショートカット学習を克服し、DL モデルが正しい病変パターンを識別できるようになり、モデルの一般化可能性が向上しました。
Two DL models were developed using radiograph-level annotations (yes or no disease) and fine-grained lesion-level annotations (lesion bounding boxes), respectively named CheXNet and CheXDet. The models' internal classification performance and lesion localization performance were compared on a testing set (n=2,922), external classification performance was compared on NIH-Google (n=4,376) and PadChest (n=24,536) datasets, and external lesion localization performance was compared on NIH-ChestX-ray14 dataset (n=880). The models were also compared to radiologists on a subset of the internal testing set (n=496). Given sufficient training data, both models performed comparably to radiologists. CheXDet achieved significant improvement for external classification, such as in classifying fracture on NIH-Google (CheXDet area under the ROC curve [AUC]: 0.67, CheXNet AUC: 0.51; p<.001) and PadChest (CheXDet AUC: 0.78, CheXNet AUC: 0.55; p<.001). CheXDet achieved higher lesion detection performance than CheXNet for most abnormalities on all datasets, such as in detecting pneumothorax on the internal set (CheXDet jacknife alternative free-response ROC-figure of merit [JAFROC-FOM]: 0.87, CheXNet JAFROC-FOM: 0.13; p<.001) and NIH-ChestX-ray14 (CheXDet JAFROC-FOM: 0.55, CheXNet JAFROC-FOM: 0.04; p<.001). To summarize, fine-grained annotations overcame shortcut learning and enabled DL models to identify correct lesion patterns, improving the models' generalizability.
updated: Tue Nov 08 2022 16:16:07 GMT+0000 (UTC)
published: Wed Apr 21 2021 14:21:37 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト