arXiv reaDer
OSS-Net: Memory Efficient High Resolution Semantic Segmentation of 3D Medical Data
畳み込みニューラルネットワーク(CNN)は、医療データのボリュームセグメンテーションのための現在の最先端のメタアルゴリズムです。たとえば、コンピューター断層撮影スキャンでCOVID-19感染組織を特定したり、磁気共鳴画像法で腫瘍ボリュームを検出したりします。 。ボクセル化されたデータに対する3DCNNの主な制限は、トレーニングデータの解像度に応じてメモリ消費量が3次的に増加することです。占有ネットワーク(O-Net)は、データが関数空間で連続的に表され、3D形状が連続的な決定境界として学習される代替手段です。 O-Netは3DCNNよりもメモリ効率が大幅に向上しますが、単純な形状に制限され、推論が比較的遅く、医療データの3Dセマンティックセグメンテーションにはまだ適合していません。ここでは、3D医療データを正確かつメモリ効率的にセグメント化するためのセマンティックセグメンテーションのための占有ネットワーク(OSS-Nets)を提案します。元のO-Netに基づいて、表現力を向上させ、3D CNNに匹敵するセグメンテーションパフォーマンスを向上させ、推論を高速化するように変更しました。ローカル観測を活用して複雑な形状を表現し、事前のエンコーダ予測を活用して推論を促進します。関数空間ベースライン(O-Net)、パフォーマンスベースライン(3D残余U-Net)、および効率ベースライン(2D残余U-Net)に対する3D脳腫瘍および肝臓セグメンテーションでのOSS-Netのパフォーマンスを紹介します。 OSS-Netは、パフォーマンスベースラインと同様のセグメンテーション結果を生成し、関数空間と効率ベースラインよりも優れています。メモリ効率の観点から、OSS-Netは、関数空間ベースラインと同等の量のメモリを消費します。これは、効率ベースラインよりもいくらか多く、パフォーマンスベースラインよりも大幅に少ないメモリです。そのため、OSS-Netは、高解像度に拡張できる、メモリ効率が高く正確な3Dセマンティックセグメンテーションを可能にします。
Convolutional neural networks (CNNs) are the current state-of-the-art meta-algorithm for volumetric segmentation of medical data, for example, to localize COVID-19 infected tissue on computer tomography scans or the detection of tumour volumes in magnetic resonance imaging. A key limitation of 3D CNNs on voxelised data is that the memory consumption grows cubically with the training data resolution. Occupancy networks (O-Nets) are an alternative for which the data is represented continuously in a function space and 3D shapes are learned as a continuous decision boundary. While O-Nets are significantly more memory efficient than 3D CNNs, they are limited to simple shapes, are relatively slow at inference, and have not yet been adapted for 3D semantic segmentation of medical data. Here, we propose Occupancy Networks for Semantic Segmentation (OSS-Nets) to accurately and memory-efficiently segment 3D medical data. We build upon the original O-Net with modifications for increased expressiveness leading to improved segmentation performance comparable to 3D CNNs, as well as modifications for faster inference. We leverage local observations to represent complex shapes and prior encoder predictions to expedite inference. We showcase OSS-Net's performance on 3D brain tumour and liver segmentation against a function space baseline (O-Net), a performance baseline (3D residual U-Net), and an efficiency baseline (2D residual U-Net). OSS-Net yields segmentation results similar to the performance baseline and superior to the function space and efficiency baselines. In terms of memory efficiency, OSS-Net consumes comparable amounts of memory as the function space baseline, somewhat more memory than the efficiency baseline and significantly less than the performance baseline. As such, OSS-Net enables memory-efficient and accurate 3D semantic segmentation that can scale to high resolutions.
updated: Wed Oct 20 2021 16:14:26 GMT+0000 (UTC)
published: Wed Oct 20 2021 16:14:26 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト