arXiv reaDer
Mixed-UNet:マルチスケール推論による弱く監視されたセマンティックセグメンテーションのための洗練されたクラスアクティベーションマッピング
Mixed-UNet: Refined Class Activation Mapping for Weakly-Supervised Semantic Segmentation with Multi-scale Inference
深層学習技術は、特に磁気共鳴画像法(MRI)スキャンまたはコンピューター断層撮影(CT)スキャンでの正確で信頼性の高い画像セグメンテーションを通じて、医用画像処理に大きな可能性を示しています。これにより、病変の位置特定と診断が可能になります。ただし、これらのセグメンテーションモデルをトレーニングするには、手動で注釈を付けた多数のピクセルレベルのラベルが必要です。これは、取得が容易な画像レベルのラベルとは対照的に、時間と労力がかかります。この問題は、人間の注釈の労力を大幅に削減できるため、画像レベルのラベルを監視として使用する、監視の弱いセマンティックセグメンテーションモデルを通じて解決することが不可欠です。高度なソリューションのほとんどは、クラスアクティベーションマッピング(CAM)を利用しています。ただし、元のCAMが病変の正確な境界をキャプチャすることはめったにありません。本研究では、シングルスケール推論における詳細損失を低減することにより、CAMを改良するためのマルチスケール推論の戦略を提案します。セグメンテーションのために、Mixed-UNetという名前の新しいモデルを開発します。これは、デコードフェーズで2つの並列ブランチを持ちます。結果は、2つのブランチから抽出された特徴を融合した後に取得できます。設計されたMixed-UNetを、地元の病院および公的データセットから収集されたデータセットに対するいくつかの一般的な深層学習ベースのセグメンテーションアプローチに対して評価します。検証結果は、私たちのモデルが、脳イメージングからのさまざまな病変のセグメンテーションにおいて、同じ監視レベルで利用可能な方法を上回っていることを示しています。
Deep learning techniques have shown great potential in medical image processing, particularly through accurate and reliable image segmentation on magnetic resonance imaging (MRI) scans or computed tomography (CT) scans, which allow the localization and diagnosis of lesions. However, training these segmentation models requires a large number of manually annotated pixel-level labels, which are time-consuming and labor-intensive, in contrast to image-level labels that are easier to obtain. It is imperative to resolve this problem through weakly-supervised semantic segmentation models using image-level labels as supervision since it can significantly reduce human annotation efforts. Most of the advanced solutions exploit class activation mapping (CAM). However, the original CAMs rarely capture the precise boundaries of lesions. In this study, we propose the strategy of multi-scale inference to refine CAMs by reducing the detail loss in single-scale reasoning. For segmentation, we develop a novel model named Mixed-UNet, which has two parallel branches in the decoding phase. The results can be obtained after fusing the extracted features from two branches. We evaluate the designed Mixed-UNet against several prevalent deep learning-based segmentation approaches on our dataset collected from the local hospital and public datasets. The validation results demonstrate that our model surpasses available methods under the same supervision level in the segmentation of various lesions from brain imaging.
updated: Fri May 06 2022 08:37:02 GMT+0000 (UTC)
published: Fri May 06 2022 08:37:02 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト