arXiv reaDer
MRI病変セグメンテーションのための目に見えないベンダードメインへの適応
Adapting to Unseen Vendor Domains for MRI Lesion Segmentation
機械学習モデルの主な制限の1つは、トレーニング分布の領域外にあるデータのパフォーマンスが低いことです。これは、磁気共鳴(MR)イメージングの画像分析に特に当てはまります。ハードウェアとソフトウェアのバリエーションにより、スキャナー全体で非標準の強度、コントラスト、ノイズ分布が生じるためです。最近、合成データポイントを作成するためにドメイン間でデータを拡張するための画像変換モデルが提案されています。この論文では、ソースデータセットからターゲットデータセットへのMR画像を増強するための教師なし画像変換モデルのアプリケーションを調査します。具体的には、これらのモデルが画像変換を通じてターゲットデータセットを表す合成データポイントをどれだけうまく作成できるかを評価し、これらの合成データポイントをトレーニングしたセグメンテーションモデルがターゲットデータセットで直接トレーニングしたモデルのパフォーマンスに近づくかどうかを確認します。画像間、スキャナーベンダー間、およびラベルから画像への変換で構成されるデータセット間の拡張の3つの構成を検討します。ラベルから画像構成までの合成データでトレーニングされたセグメンテーションモデルは、ターゲットデータセットで直接トレーニングされたセグメンテーションモデルに最も近いパフォーマンスをもたらすことがわかりました。合成データのトレーニングの各ターゲットベンダー(GE、Siemens、Philips)ごとのダイス係数スコアは0.63、0.64、および0.58でしたが、ターゲットデータセットの直接トレーニングは0.65、0.72、および0.61でした。
One of the key limitations in machine learning models is poor performance on data that is out of the domain of the training distribution. This is especially true for image analysis in magnetic resonance (MR) imaging, as variations in hardware and software create non-standard intensities, contrasts, and noise distributions across scanners. Recently, image translation models have been proposed to augment data across domains to create synthetic data points. In this paper, we investigate the application an unsupervised image translation model to augment MR images from a source dataset to a target dataset. Specifically, we want to evaluate how well these models can create synthetic data points representative of the target dataset through image translation, and to see if a segmentation model trained these synthetic data points would approach the performance of a model trained directly on the target dataset. We consider three configurations of augmentation between datasets consisting of translation between images, between scanner vendors, and from labels to images. It was found that the segmentation models trained on synthetic data from labels to images configuration yielded the closest performance to the segmentation model trained directly on the target dataset. The Dice coeffcient score per each target vendor (GE, Siemens, Philips) for training on synthetic data was 0.63, 0.64, and 0.58, compared to training directly on target dataset was 0.65, 0.72, and 0.61.
updated: Sat Aug 14 2021 01:09:43 GMT+0000 (UTC)
published: Sat Aug 14 2021 01:09:43 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト