arXiv reaDer
脊椎X線写真のための生成的敵対的ネットワークベースの合成学習と新しいドメイン関連損失項
Generative Adversarial Network Based Synthetic Learning and a Novel Domain Relevant Loss Term for Spine Radiographs
問題:データ収集の時間コストとプライバシーの懸念を特徴とする、医学における深層学習モデルのトレーニングのためのビッグデータが不足しています。生成的敵対的ネットワーク(GAN)は、新しいデータを生成する可能性と、患者の実際のデータを含めずにこの新しく生成されたデータをダウンストリームアプリケーションに使用する可能性の両方を提供します。アプローチ:一連のGANがトレーニングされ、下流のコンピュータービジョン脊椎X線写真の異常分類タスクに適用されました。個別の分類器は、元の画像へのアクセスまたはアクセスなしのいずれかでトレーニングされました。訓練されたGANには、適応弁別器増強を伴う条件付きStyleGAN2、病変タイプを条件とする脊椎X線写真を生成するための適応弁別子増強を伴う条件付きStyleGAN2、および異常を条件とする適応弁別増強を伴うStyleGAN2(SpineGAN)を生成するための新しい臨床損失項の使用が含まれていました。最後に、異常を条件とする適応弁別器増強を備えた差分プライバシー課されたStyleGAN2が訓練され、その差分プライバシー課されたアブレーション研究が行われた。主な結果:文献レビューから初めて、意味のある入力なしで合成脊椎X線写真のGAN生成を達成しました。さらに、下流の臨床分類タスクを使用した脊椎ドメインの合成学習の成功を示します(実際のデータを使用した0.886のAUCと比較した合成データを使用した0.830のAUC)。重要なことに、ジェネレーターの新しい臨床損失項の導入は、世代の想起を高め、モデルのトレーニングを加速することがわかりました。最後に、限られたサイズの医療データセットでは、差分プライバシーの強制がGANトレーニングを大幅に妨げることを示し、これは特にノイズによる勾配摂動の要件によるものであることがわかりました。
Problem: There is a lack of big data for the training of deep learning models in medicine, characterized by the time cost of data collection and privacy concerns. Generative adversarial networks (GANs) offer both the potential to generate new data, as well as to use this newly generated data, without inclusion of patients' real data, for downstream applications. Approach: A series of GANs were trained and applied for a downstream computer vision spine radiograph abnormality classification task. Separate classifiers were trained with either access or no access to the original imaging. Trained GANs included a conditional StyleGAN2 with adaptive discriminator augmentation, a conditional StyleGAN2 with adaptive discriminator augmentation to generate spine radiographs conditional on lesion type, and using a novel clinical loss term for the generator a StyleGAN2 with adaptive discriminator augmentation conditional on abnormality (SpineGAN). Finally, a differential privacy imposed StyleGAN2 with adaptive discriminator augmentation conditional on abnormality was trained and an ablation study was performed on its differential privacy impositions. Key Results: We accomplish GAN generation of synthetic spine radiographs without meaningful input for the first time from a literature review. We further demonstrate the success of synthetic learning for the spine domain with a downstream clinical classification task (AUC of 0.830 using synthetic data compared to AUC of 0.886 using the real data). Importantly, the introduction of a new clinical loss term for the generator was found to increase generation recall as well as accelerate model training. Lastly, we demonstrate that, in a limited size medical dataset, differential privacy impositions severely impede GAN training, finding that this is specifically due to the requirement for gradient perturbation with noise.
updated: Thu May 05 2022 03:58:19 GMT+0000 (UTC)
published: Thu May 05 2022 03:58:19 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト