arXiv reaDer
1億の医用画像からの自己監視学習
Self-supervised Learning from 100 Million Medical Images
医療画像評価のための正確で堅牢な人工知能システムを構築するには、高度な深層学習モデルの研究と設計だけでなく、注釈付きのトレーニング例の大規模で精選されたセットの作成も必要です。ただし、このようなデータセットの構築は、注釈タスクの複雑な性質と医用画像の解釈に必要な高度な専門知識(専門の放射線科医など)のために、多くの場合非常にコストがかかります。この制限に対抗するために、対照学習とオンライン特徴クラスタリングに基づく豊富な画像特徴の自己監視学習の方法を提案します。この目的のために、X線撮影、コンピューター断層撮影(CT)、磁気共鳴(MR)画像、超音波検査など、さまざまなモダリティの1億を超える医用画像の大規模なトレーニングデータセットを活用しています。これらの機能を使用して、さまざまなダウンストリームタスクでの監視ありおよびハイブリッドの自己監視/監視ありレジームでのモデルトレーニングをガイドすることを提案します。 X線撮影、CT、およびMRにおける画像評価の問題に挑戦する上で、この戦略の多くの利点を強調します。胸部X線スキャンおよび脳CTでの出血検出による異常); 2)事前トレーニングを使用しない場合と比較して、トレーニング中のモデル収束が最大85%加速します(たとえば、MRスキャンで脳転移を検出するためにモデルをトレーニングする場合は83%)。 3)強度の変動、回転、フィールドで見られるデータの変動を反映したスケーリングなど、さまざまな画像増強に対するロバスト性の向上。
Building accurate and robust artificial intelligence systems for medical image assessment requires not only the research and design of advanced deep learning models but also the creation of large and curated sets of annotated training examples. Constructing such datasets, however, is often very costly -- due to the complex nature of annotation tasks and the high level of expertise required for the interpretation of medical images (e.g., expert radiologists). To counter this limitation, we propose a method for self-supervised learning of rich image features based on contrastive learning and online feature clustering. For this purpose we leverage large training datasets of over 100,000,000 medical images of various modalities, including radiography, computed tomography (CT), magnetic resonance (MR) imaging and ultrasonography. We propose to use these features to guide model training in supervised and hybrid self-supervised/supervised regime on various downstream tasks. We highlight a number of advantages of this strategy on challenging image assessment problems in radiography, CT and MR: 1) Significant increase in accuracy compared to the state-of-the-art (e.g., AUC boost of 3-7% for detection of abnormalities from chest radiography scans and hemorrhage detection on brain CT); 2) Acceleration of model convergence during training by up to 85% compared to using no pretraining (e.g., 83% when training a model for detection of brain metastases in MR scans); 3) Increase in robustness to various image augmentations, such as intensity variations, rotations or scaling reflective of data variation seen in the field.
updated: Tue Jan 04 2022 18:27:04 GMT+0000 (UTC)
published: Tue Jan 04 2022 18:27:04 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト