Transferability of Deep Learning Algorithms for Malignancy Detection in Confocal Laser Endomicroscopy Images from Different Anatomical Locations of the Upper Gastrointestinal Tract
 扁平上皮癌(SCC)は上皮の最も一般的な癌の種類であり、しばしば後期に検出されます。生検および組織病理学的評価によるSCCの侵襲的診断に加えて、共焦点レーザー内視鏡検査(CLE)は、in vivoでSCCを診断するために使用される非侵襲的方法として浮上しています。ただし、CLE画像の解釈には、広範なトレーニングが必要であり、そのため、メソッドの臨床実践での適用性と使用が制限されます。より広い範囲でSCCの診断を支援するために、自動検出方法が提案されています。この研究では、転移学習の意味での適用性に関して2つの方法を比較しています。つまり、1つの組織タイプ(1つの臨床チームから)でのトレーニングと、学習した分類システムを別のエンティティ(異なる解剖学、異なる臨床チーム)に適用します。畳み込みニューラルネットワークに基づく以前に提案されたパッチベースの方法に加えて、画像レベルでの新しい分類方法(クラスの活性化マップの専用の前処理と解釈を備えた事前訓練されたInception V.3ネットワークに基づく)が提案および評価されます。新しく提示されたアプローチにより、認識パフォーマンスが向上し、最初のデータセット(口腔)で91.63%、ジョイントデータセットで92.63%の精度が得られます。口腔から2番目のデータセット(声帯)への一般化は、声帯データセットでの直接トレーニングよりもROC曲線下面積値に類似しており、良好な一般化を示しています。
Squamous Cell Carcinoma (SCC) is the most common cancer type of the epithelium and is often detected at a late stage. Besides invasive diagnosis of SCC by means of biopsy and histo-pathologic assessment, Confocal Laser Endomicroscopy (CLE) has emerged as noninvasive method that was successfully used to diagnose SCC in vivo. For interpretation of CLE images, however, extensive training is required, which limits its applicability and use in clinical practice of the method. To aid diagnosis of SCC in a broader scope, automatic detection methods have been proposed. This work compares two methods with regard to their applicability in a transfer learning sense, i.e. training on one tissue type (from one clinical team) and applying the learnt classification system to another entity (different anatomy, different clinical team). Besides a previously proposed, patch-based method based on convolutional neural networks, a novel classification method on image level (based on a pre-trained Inception V.3 network with dedicated preprocessing and interpretation of class activation maps) is proposed and evaluated. The newly presented approach improves recognition performance, yielding accuracies of 91.63% on the first data set (oral cavity) and 92.63% on a joint data set. The generalization from oral cavity to the second data set (vocal folds) lead to similar area-under-the-ROC curve values than a direct training on the vocal folds data set, indicating good generalization.
updated: Fri Jan 03 2020 13:38:45 GMT+0000 (UTC)
published: Sun Feb 24 2019 17:38:25 GMT+0000 (UTC)
