近年、3D畳み込みニューラルネットワークは、体積医療画像セグメンテーションの主要なアプローチになっています。ただし、2Dネットワークと比較すると、3Dネットワークでは、トレーニングパラメータが大幅に増え、GPUメモリの要件が高くなります。これは、高解像度のボリューム画像用の3Dネットワークを設計およびトレーニングするための主要な制限要因になっています。この作業では、3D高解像度画像セグメンテーションのための新しいメモリ効率の高いネットワークアーキテクチャを提案します。ネットワークには、2段階のU-netベースのカスケードフレームワークを介してグローバル機能とローカル機能の両方が組み込まれており、最初の段階では、メモリ効率の高いU-net(meU-net)が開発されます。 2つの段階で学習した機能は、ポスト連結を介して接続され、情報の流れがさらに改善されます。提案されたセグメンテーション方法は、ボリュームあたり通常2億5000万ボクセルの超高解像度microCTデータセットで評価されます。実験によると、セグメンテーションの精度とメモリ効率の両方の点で、最先端の3Dセグメンテーション手法よりも優れています。
In recent years, 3D convolutional neural networks have become the dominant approach for volumetric medical image segmentation. However, compared to their 2D counterparts, 3D networks introduce substantially more training parameters and higher requirement for the GPU memory. This has become a major limiting factor for designing and training 3D networks for high-resolution volumetric images. In this work, we propose a novel memory-efficient network architecture for 3D high-resolution image segmentation. The network incorporates both global and local features via a two-stage U-net-based cascaded framework and at the first stage, a memory-efficient U-net (meU-net) is developed. The features learnt at the two stages are connected via post-concatenation, which further improves the information flow. The proposed segmentation method is evaluated on an ultra high-resolution microCT dataset with typically 250 million voxels per volume. Experiments show that it outperforms state-of-the-art 3D segmentation methods in terms of both segmentation accuracy and memory efficiency.