Distributionally Robust Segmentation of Abnormal Fetal Brain 3D MRI
ディープニューラルネットワークのパフォーマンスは、通常、トレーニング画像の数とともに増加します。ただし、すべての画像がパフォーマンスと堅牢性の向上に同じ重要性を持っているわけではありません。胎児の脳MRIでは、異常は非病理学的症例と比較して発達中の脳の解剖学的構造の変動性を悪化させます。トレーニングに使用される臨床データセットで通常利用できるような少数の異常な症例は、異常な発達中の脳の豊富な変動性を公正に表す可能性は低いです。これにより、平均パフォーマンスを最大化することによってトレーニングされた機械学習システムが、非病理学的ケースに偏るようになります。この問題は最近、隠れた層別化と呼ばれていました。臨床使用に適しているためには、自動セグメンテーション方法は、病理学的症例に対しても高品質のセグメンテーション結果を確実に達成する必要があります。この論文では、最先端の深層学習パイプラインnnU-Netが、目に見えない異常なケースに一般化するのが難しいことを示します。この問題を軽減するために、データセット全体のボリュームごとの損失の分布のパーセンタイルを最小化するようにディープニューラルネットワークをトレーニングすることを提案します。これは、Distributionly Robust Optimization(DRO)を使用することで実現できることを示しています。 DROは、パフォーマンスの低いトレーニングサンプルを自動的に再重み付けし、nnU-Netがすべてのケースでより一貫して実行するように促します。オープン二分脊椎症例の124MRIと脳発達の他の重度の異常を伴う症例の51MRIを含む、368の胎児脳T2wMRIのデータセットを使用してアプローチを検証しました。
The performance of deep neural networks typically increases with the number of training images. However, not all images have the same importance towards improved performance and robustness. In fetal brain MRI, abnormalities exacerbate the variability of the developing brain anatomy compared to non-pathological cases. A small number of abnormal cases, as is typically available in clinical datasets used for training, are unlikely to fairly represent the rich variability of abnormal developing brains. This leads machine learning systems trained by maximizing the average performance to be biased toward non-pathological cases. This problem was recently referred to as hidden stratification. To be suited for clinical use, automatic segmentation methods need to reliably achieve high-quality segmentation outcomes also for pathological cases. In this paper, we show that the state-of-the-art deep learning pipeline nnU-Net has difficulties to generalize to unseen abnormal cases. To mitigate this problem, we propose to train a deep neural network to minimize a percentile of the distribution of per-volume loss over the dataset. We show that this can be achieved by using Distributionally Robust Optimization (DRO). DRO automatically reweights the training samples with lower performance, encouraging nnU-Net to perform more consistently on all cases. We validated our approach using a dataset of 368 fetal brain T2w MRIs, including 124 MRIs of open spina bifida cases and 51 MRIs of cases with other severe abnormalities of brain development.
updated: Mon Aug 09 2021 17:00:21 GMT+0000 (UTC)
published: Mon Aug 09 2021 17:00:21 GMT+0000 (UTC)
