arXiv reaDer
医用画像生成によるデータ共有の障壁の克服:包括的な評価
Overcoming Barriers to Data Sharing with Medical Image Generation: A Comprehensive Evaluation
個人を特定できる情報の共有に関するプライバシーの懸念は、医学研究におけるデータ共有の主要な実際的な障壁です。ただし、多くの場合、研究者は特定の個人の情報に関心がなく、コホートのレベルで洞察を引き出すことを目的としています。ここでは、Generative Adversarial Networks(GAN)を利用して、完全に合成患者データで構成される派生医用画像データセットを作成します。合成画像は、理想的には、ソースデータセットと同様の統計的特性を備えていますが、機密性の高い個人情報は含まれていません。 14の異なる放射線所見を伴う胸部X線写真と6種類の頭蓋内出血を伴う脳コンピューター断層撮影(CT)スキャンの2つのGANモデルによって生成された合成データの品質を評価します。合成データセットまたは実際のデータセットのいずれかでトレーニングされた予測モデルのパフォーマンスの違いによって、合成画質を測定します。合成データのパフォーマンスは、一意のラベルの組み合わせの数を減らすことで不釣り合いに恩恵を受けることがわかりました。私たちのオープンソースベンチマークは、クラスあたりのサンプル数が少ないと、ラベルの過剰適合効果がGANトレーニングを支配し始めることも示しています。さらに、訓練を受けた放射線科医が、中間レベルの解像度で合成画像と実際の医用画像を区別する際に、ランダムよりも優れたパフォーマンスを発揮しないリーダー調査を実施しました。私たちのベンチマーク結果によれば、放射線科医の分類精度は、より高い空間分解能レベルで向上します。私たちの研究は、貴重なガイドラインを提供し、合成医用画像から得られた洞察が実際の画像データから得られた洞察と類似している実際の条件を概説しています。私たちの結果は、合成データ共有は、適切な設定で実際の患者レベルのデータを共有する代わりに、魅力的でプライバシーを保護する代替手段である可能性があることを示しています。
Privacy concerns around sharing personally identifiable information are a major practical barrier to data sharing in medical research. However, in many cases, researchers have no interest in a particular individual's information but rather aim to derive insights at the level of cohorts. Here, we utilize Generative Adversarial Networks (GANs) to create derived medical imaging datasets consisting entirely of synthetic patient data. The synthetic images ideally have, in aggregate, similar statistical properties to those of a source dataset but do not contain sensitive personal information. We assess the quality of synthetic data generated by two GAN models for chest radiographs with 14 different radiology findings and brain computed tomography (CT) scans with six types of intracranial hemorrhages. We measure the synthetic image quality by the performance difference of predictive models trained on either the synthetic or the real dataset. We find that synthetic data performance disproportionately benefits from a reduced number of unique label combinations. Our open-source benchmark also indicates that at low number of samples per class, label overfitting effects start to dominate GAN training. We additionally conducted a reader study in which trained radiologists do not perform better than random on discriminating between synthetic and real medical images for intermediate levels of resolutions. In accordance with our benchmark results, the classification accuracy of radiologists increases at higher spatial resolution levels. Our study offers valuable guidelines and outlines practical conditions under which insights derived from synthetic medical images are similar to those that would have been derived from real imaging data. Our results indicate that synthetic data sharing may be an attractive and privacy-preserving alternative to sharing real patient-level data in the right settings.
updated: Sat Jul 24 2021 07:59:44 GMT+0000 (UTC)
published: Sun Nov 29 2020 15:41:46 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト