トレーニング中にラベルが付けられていない、または存在しない疾患が存在する場合の深層学習モデルのパフォーマンスを体系的に評価します。最初に、疾患のサブセット(見られる疾患)でトレーニングされた深層学習モデルが、より大きな一連の疾患のいずれかの存在を検出できるかどうかを評価します。モデルは、サブセット外の疾患(目に見えない疾患)を「疾患なし」として誤って分類する傾向があることがわかります。次に、見られた病気で訓練されたモデルが、サブセット外の病気(見えない病気)と同時発生したときに見られた病気を検出できるかどうかを評価します。モデルは、目に見えない病気と同時発生した場合でも、目に見える病気を検出できることがわかりました。第三に、モデルによって学習された特徴表現を使用して、目に見えない病気の小さなラベル付きセットが与えられた場合に、目に見えない病気の存在を検出できるかどうかを評価します。ディープニューラルネットワークの最後から2番目の層が、目に見えない病気の検出に役立つ機能を提供することがわかりました。私たちの結果は、非網羅的な一連の疾患クラスでトレーニングされた深層学習モデルの安全な臨床展開に情報を提供することができます。
We systematically evaluate the performance of deep learning models in the presence of diseases not labeled for or present during training. First, we evaluate whether deep learning models trained on a subset of diseases (seen diseases) can detect the presence of any one of a larger set of diseases. We find that models tend to falsely classify diseases outside of the subset (unseen diseases) as "no disease". Second, we evaluate whether models trained on seen diseases can detect seen diseases when co-occurring with diseases outside the subset (unseen diseases). We find that models are still able to detect seen diseases even when co-occurring with unseen diseases. Third, we evaluate whether feature representations learned by models may be used to detect the presence of unseen diseases given a small labeled set of unseen diseases. We find that the penultimate layer of the deep neural network provides useful features for unseen disease detection. Our results can inform the safe clinical deployment of deep learning models trained on a non-exhaustive set of disease classes.