arXiv reaDer
CAN3D:コンパクトなコンテキストアグリゲーションによる高速3D医療画像セグメンテーション
CAN3D: Fast 3D Medical Image Segmentation via Compact Context Aggregation
磁気共鳴(MR)イメージングなど、3D医用イメージングからのオブジェクトの直接自動セグメンテーションは、調査中の大量の複雑な形状を持つ多数の個々のオブジェクトを正確に識別する必要があるため、困難です。これらの課題に対処するために、ほとんどの深層学習アプローチは通常、モデル内の複雑さまたはトレーニング可能なパラメーターの数を大幅に増やすことにより、学習能力を強化します。その結果、これらのモデルは一般に、臨床MRシステムを操作する標準的なワークステーションで長い推論時間を必要とし、メモリ要件が大きいため、高性能コンピューティングハードウェアに制限されます。さらに、限られたコンピュータメモリを使用してこれらの大規模モデルに3Dデータセットを適合させるために、パッチワイズトレーニングなどのトレードオフ手法がよく使用されます。これは、診断目的で臨床的に重要な入力画像からの微細な幾何学的情報を犠牲にします。これらの課題に対処するために、メモリフットプリントが浅いコンパクトな畳み込みニューラルネットワークを提示して、最先端のパフォーマンスに必要なモデルパラメータの数を効率的に削減します。ほとんどの臨床環境には、限られた計算能力とメモリを備えたローエンドのハードウェアしかないため、これは実際の雇用にとって重要です。提案されたネットワークは、パッチを必要とせずに大規模なフルサイズの3D入力ボリュームを直接処理することでデータの整合性を維持でき、トレーニングと推論の両方に必要な計算時間を大幅に短縮します。また、3D MR画像の不均衡なクラスの精度を向上させるために、追加の形状制約を備えた新しい損失関数を提案します。
Direct automatic segmentation of objects from 3D medical imaging, such as magnetic resonance (MR) imaging, is challenging as it often involves accurately identifying a number of individual objects with complex geometries within a large volume under investigation. To address these challenges, most deep learning approaches typically enhance their learning capability by substantially increasing the complexity or the number of trainable parameters within their models. Consequently, these models generally require long inference time on standard workstations operating clinical MR systems and are restricted to high-performance computing hardware due to their large memory requirement. Further, to fit 3D dataset through these large models using limited computer memory, trade-off techniques such as patch-wise training are often used which sacrifice the fine-scale geometric information from input images which could be clinically significant for diagnostic purposes. To address these challenges, we present a compact convolutional neural network with a shallow memory footprint to efficiently reduce the number of model parameters required for state-of-art performance. This is critical for practical employment as most clinical environments only have low-end hardware with limited computing power and memory. The proposed network can maintain data integrity by directly processing large full-size 3D input volumes with no patches required and significantly reduces the computational time required for both training and inference. We also propose a novel loss function with extra shape constraint to improve the accuracy for imbalanced classes in 3D MR images.
updated: Sun Sep 12 2021 06:27:59 GMT+0000 (UTC)
published: Sun Sep 12 2021 06:27:59 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト