Region-based Convolution Neural Network Approach for Accurate Segmentation of Pelvic Radiograph
 診断、治療計画、および臨床研究のための最も一般的な医療画像システムとしてのレントゲン画像の使用の増加に伴い、機械学習ベースのシステムを使用して手術の事前計画に信頼できる情報を提供することがますます重要な要素になっています。 X線画像での骨盤のセグメンテーションは、自動姿勢推定や疾患検出などの一部のアプリケーションにとって重要な前処理ステップです。ただし、U-Netとして知られるエンコーダー/デコーダースタイルのネットワークは、特に重度の患者では骨盤の形状が複雑であるため、限られた結果しか示していません。本稿では、マスクR-CNNアーキテクチャに基づく新しいマルチタスクセグメンテーション手法を提案します。トレーニングのために、ネットワークの重みは大きな非医療データセットによって初期化され、X線写真画像で微調整されました。さらに、トレーニングプロセスでは、ネットワークパフォーマンスを改善するために拡張データが生成されました。私たちの実験は、マルチタスク学習、転送学習、およびデータ増大技術を利用したMask R-CNNが0.96 DICE係数を達成し、U-Netを大幅に上回ることを示しています。特に、公正な比較のために、U-netトレーニングにも同じ転送学習とデータ拡張の手法が使用されています。
With the increasing usage of radiograph images as a most common medical imaging system for diagnosis, treatment planning, and clinical studies, it is increasingly becoming a vital factor to use machine learning-based systems to provide reliable information for surgical pre-planning. Segmentation of pelvic bone in radiograph images is a critical preprocessing step for some applications such as automatic pose estimation and disease detection. However, the encoder-decoder style network known as U-Net has demonstrated limited results due to the challenging complexity of the pelvic shapes, especially in severe patients. In this paper, we propose a novel multi-task segmentation method based on Mask R-CNN architecture. For training, the network weights were initialized by large non-medical dataset and fine-tuned with radiograph images. Furthermore, in the training process, augmented data was generated to improve network performance. Our experiments show that Mask R-CNN utilizing multi-task learning, transfer learning, and data augmentation techniques achieve 0.96 DICE coefficient, which significantly outperforms the U-Net. Notably, for a fair comparison, the same transfer learning and data augmentation techniques have been used for U-net training.
updated: Tue Dec 31 2019 12:49:11 GMT+0000 (UTC)
published: Tue Oct 29 2019 12:45:21 GMT+0000 (UTC)
