Learn to Ignore: Domain Adaptation for Multi-Site MRI Analysis
大きな画像データセットの限られた可用性は、医学における正確で一般化可能な機械学習方法の開発における主要な問題です。データ量の制限は、主に、さまざまな取得プロトコル、さまざまなハードウェア、およびデータプライバシーの使用によるものです。同時に、小さなデータセットで分類モデルをトレーニングすると、モデルの一般化品質が低下します。この問題を克服するために、出所の異なるさまざまな画像データセットの組み合わせがよく使用されます(例:マルチサイト研究)。ただし、追加のデータセットにタスクのすべてのクラスが含まれていない場合、分類モデルの学習はデバイスまたは取得場所に偏る可能性があります。これは特に磁気共鳴(MR)画像の場合であり、さまざまなMRスキャナーがモデルのパフォーマンスを制限するバイアスを導入します。この論文では、分類タスクに関連する特徴を学習しながら、画像に存在するスキャナー関連の特徴を無視することを学習する新しい方法を提示します。小さなデータセットだけがすべてのクラスの画像を提供する実際のシナリオに焦点を当てます。この状況を利用して、潜在空間に特定の追加の制約を導入します。これにより、スキャナー固有の機能ではなく、疾患に関連する機能に焦点が当てられます。私たちの方法Learnto Ignoreは、多発性硬化症患者と健康な被験者の間の分類タスクで、マルチサイトMRIデータセットの最先端のドメイン適応方法よりも優れています。
Limited availability of large image datasets is a major issue in the development of accurate and generalizable machine learning methods in medicine. The limitations in the amount of data are mainly due to the use of different acquisition protocols, different hardware, and data privacy. At the same time, training a classification model on a small dataset leads to a poor generalization quality of the model. To overcome this issue, a combination of various image datasets of different provenance is often used, e.g., multi-site studies. However, if an additional dataset does not include all classes of the task, the learning of the classification model can be biased to the device or place of acquisition. This is especially the case for Magnetic Resonance (MR) images, where different MR scanners introduce a bias that limits the performance of the model. In this paper, we present a novel method that learns to ignore the scanner-related features present in the images, while learning features relevant for the classification task. We focus on a real-world scenario, where only a small dataset provides images of all classes. We exploit this circumstance by introducing specific additional constraints on the latent space, which lead the focus on disease-related rather than scanner-specific features. Our method Learn to Ignore outperforms state-of-the-art domain adaptation methods on a multi-site MRI dataset on a classification task between Multiple Sclerosis patients and healthy subjects.
updated: Wed Oct 13 2021 15:40:50 GMT+0000 (UTC)
published: Wed Oct 13 2021 15:40:50 GMT+0000 (UTC)
