arXiv reaDer
医療画像セグメンテーションにおけるハイパーパラメータ最適化のためのプロキシデータとプロキシネットワークの力
The Power of Proxy Data and Proxy Networks for Hyper-Parameter Optimization in Medical Image Segmentation
医療画像セグメンテーションの深層学習モデルは、主にデータ駆動型です。より多くのデータでトレーニングされたモデルは、パフォーマンスと一般化可能性の向上につながります。ただし、最高のパフォーマンスを得るための最適な設定を見つけるには、複数のハイパーパラメータをテストする必要があるため、トレーニングは計算コストの高いプロセスです。この作業では、プロキシデータとプロキシネットワークという2つの新しい方法論を提案することにより、ハイパーパラメータの推定を加速することに焦点を当てます。どちらも、ハイパーパラメータをより効率的に推定するのに役立ちます。よく知られている公開データセットを使用して、CTおよびMRイメージングモダリティで提案された手法をテストします。どちらの場合も、プロキシデータを構築するために1つのデータセットを使用し、外部評価のために別のデータソースを使用します。 CTの場合、このアプローチは2つのデータセットを使用した脾臓セグメンテーションでテストされます。最初のデータセットは、プロキシデータが構築される医療セグメンテーション十種競技(MSD)からのものであり、2番目のデータセットは外部検証データセットとして利用されます。同様に、MRの場合、アプローチは、最初のデータセットがMSDからのもので、2番目のデータセットがPROSTATExである前立腺セグメンテーションで評価されます。まず、プロキシデータのランダムな選択よりも小さいプロキシデータを使用して外部検証セットでテストする場合、トレーニングに完全なデータを使用することとの相関が高いことを示します。次に、検証ダイススコアで完全なネットワークと比較した場合、プロキシネットワークに高い相関関係が存在することを示します。第三に、プロキシネットワークを利用する提案されたアプローチは、ハイパーパラメータ検索のAutoMLフレームワークを3.3倍、プロキシデータとプロキシネットワークを一緒に利用した場合は4.4倍高速化できることを示します。
Deep learning models for medical image segmentation are primarily data-driven. Models trained with more data lead to improved performance and generalizability. However, training is a computationally expensive process because multiple hyper-parameters need to be tested to find the optimal setting for best performance. In this work, we focus on accelerating the estimation of hyper-parameters by proposing two novel methodologies: proxy data and proxy networks. Both can be useful for estimating hyper-parameters more efficiently. We test the proposed techniques on CT and MR imaging modalities using well-known public datasets. In both cases using one dataset for building proxy data and another data source for external evaluation. For CT, the approach is tested on spleen segmentation with two datasets. The first dataset is from the medical segmentation decathlon (MSD), where the proxy data is constructed, the secondary dataset is utilized as an external validation dataset. Similarly, for MR, the approach is evaluated on prostate segmentation where the first dataset is from MSD and the second dataset is PROSTATEx. First, we show higher correlation to using full data for training when testing on the external validation set using smaller proxy data than a random selection of the proxy data. Second, we show that a high correlation exists for proxy networks when compared with the full network on validation Dice score. Third, we show that the proposed approach of utilizing a proxy network can speed up an AutoML framework for hyper-parameter search by 3.3x, and by 4.4x if proxy data and proxy network are utilized together.
updated: Mon Jul 12 2021 14:37:08 GMT+0000 (UTC)
published: Mon Jul 12 2021 14:37:08 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト