arXiv reaDer
臨床データ倉庫のための脳T1強調磁気共鳴画像の自動品質管理
Automatic quality control of brain T1-weighted magnetic resonance images for a clinical data warehouse
コンピュータ支援診断のための機械学習(ML)に関する多くの研究は、これまでほとんどが高品質の研究データに限定されてきました。病院から定期検査を収集する臨床データウェアハウスは、現実的な設定でのMLモデルのトレーニングと検証に大きな期待を寄せています。ただし、このような臨床データウェアハウスを使用するには、品質管理(QC)ツールが必要です。専門家によるビジュアルQCは時間がかかり、大規模なデータセットに拡張できません。この論文では、大規模な異種臨床データウェアハウスの3D T1強調脳MRIの自動QCのための畳み込みニューラルネットワーク(CNN)を提案します。そのために、グレーターパリ地域の病院のデータウェアハウス(Assistance Publique-H \ ^ opitaux de Paris [AP-HP])を使用しました。具体的には、目的は次のとおりです。1)適切なT1強調脳MRIではない画像を特定する。 2)ガドリニウムが注入された取得を特定する。 3)全体的な画質を評価します。トレーニングと検証には5000枚の画像を使用し、テストには500枚の画像の別のセットを使用しました。 CNNをトレーニング/検証するために、データウェアハウスの設定でのアプリケーション用に特別に設計されたビジュアルQCプロトコルに従って、トレーニングを受けた2人の評価者がデータに注釈を付けました。目標1と2について、私たちのアプローチは、人間の評価者と同様に、優れた精度(バランスの取れた精度とF1スコア\ textgreater 90%)を達成しました。目標3の場合、パフォーマンスは良好でしたが、人間の評価者よりも大幅に低くなりました。それにもかかわらず、自動アプローチは、通常は除外する必要がある低品質の画像を正確に識別しました(バランスの取れた精度とF1スコア\ textgreater 80%)。全体として、私たちのアプローチは、医用画像コンピューティングで病院のデータウェアハウスを活用するのに役立ちます。
Many studies on machine learning (ML) for computer-aided diagnosis have so far been mostly restricted to high-quality research data. Clinical data warehouses, gathering routine examinations from hospitals, offer great promises for training and validation of ML models in a realistic setting. However, the use of such clinical data warehouses requires quality control (QC) tools. Visual QC by experts is time-consuming and does not scale to large datasets. In this paper, we propose a convolutional neural network (CNN) for the automatic QC of 3D T1-weighted brain MRI for a large heterogeneous clinical data warehouse. To that purpose, we used the data warehouse of the hospitals of the Greater Paris area (Assistance Publique-H\^opitaux de Paris [AP-HP]). Specifically, the objectives were: 1) to identify images which are not proper T1-weighted brain MRIs; 2) to identify acquisitions for which gadolinium was injected; 3) to rate the overall image quality. We used 5000 images for training and validation and a separate set of 500 images for testing. In order to train/validate the CNN, the data were annotated by two trained raters according to a visual QC protocol that we specifically designed for application in the setting of a data warehouse. For objectives 1 and 2, our approach achieved excellent accuracy (balanced accuracy and F1-score \textgreater 90%), similar to the human raters. For objective 3, the performance was good but substantially lower than that of human raters. Nevertheless, the automatic approach accurately identified (balanced accuracy and F1-score \textgreater 80%) low quality images, which would typically need to be excluded. Overall, our approach shall be useful for exploiting hospital data warehouses in medical image computing.
updated: Fri Apr 16 2021 14:27:43 GMT+0000 (UTC)
published: Fri Apr 16 2021 14:27:43 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト