ディープニューラルネットワークにより、非常に正確な画像セグメンテーションが可能になりますが、教師付きトレーニングには大量の手動注釈付きデータが必要です。数発の学習は、注釈付きのいくつかのサポート例から新しいクラスを学習することにより、この欠点に対処することを目的としています。いくつかの注釈付きスライスのみを使用したボリューム医療画像のセグメンテーションのための、新しい少数ショットフレームワークを紹介します。コンピュータービジョンの他の関連作品と比較して、主要な課題は、事前に訓練されたネットワークの欠如と医療スキャンの体積特性です。これらの課題に対処するには、「スクイーズ&エキサイティング」ブロックを組み込んだ少数ショットセグメンテーションの新しいアーキテクチャを提案します。 2アームアーキテクチャは、注釈付きのサポート入力を処理し、タスク固有の表現を生成するコンディショナーアームで構成されています。この表現は、この情報を使用して新しいクエリイメージをセグメント化するセグメンターアームに渡されます。コンディショナーとセグメンターアーム間の効率的な相互作用を促進するために、モデルの複雑さをほとんど増加させずに両方のアーム間の重い相互作用を可能にする「チャネルスクイーズ&空間励起」ブロック-軽量計算モジュールを使用することを提案します。この貢献により、事前にトレーニングされたモデルに依存せずに画像のセグメンテーションを実行できます。これは通常、医療スキャンでは利用できません。さらに、サポートボリュームのいくつかのスライスをクエリボリュームのすべてのスライスに最適にペアリングすることにより、ボリュームセグメンテーションの効率的な戦略を提案します。内臓データセットからの全身造影CTスキャンで臓器セグメンテーションの実験を行います。提案されたモデルは、セグメンテーション精度に関して、複数のベースラインおよび既存のアプローチよりも大幅に優れています。ソースコードはhttps://github.com/abhi4ssj/few-shot-segmentationで入手できます。
Deep neural networks enable highly accurate image segmentation, but require large amounts of manually annotated data for supervised training. Few-shot learning aims to address this shortcoming by learning a new class from a few annotated support examples. We introduce, a novel few-shot framework, for the segmentation of volumetric medical images with only a few annotated slices. Compared to other related works in computer vision, the major challenges are the absence of pre-trained networks and the volumetric nature of medical scans. We address these challenges by proposing a new architecture for few-shot segmentation that incorporates 'squeeze & excite' blocks. Our two-armed architecture consists of a conditioner arm, which processes the annotated support input and generates a task-specific representation. This representation is passed on to the segmenter arm that uses this information to segment the new query image. To facilitate efficient interaction between the conditioner and the segmenter arm, we propose to use 'channel squeeze & spatial excitation' blocks - a light-weight computational module - that enables heavy interaction between both the arms with negligible increase in model complexity. This contribution allows us to perform image segmentation without relying on a pre-trained model, which generally is unavailable for medical scans. Furthermore, we propose an efficient strategy for volumetric segmentation by optimally pairing a few slices of the support volume to all the slices of the query volume. We perform experiments for organ segmentation on whole-body contrast-enhanced CT scans from the Visceral Dataset. Our proposed model outperforms multiple baselines and existing approaches with respect to the segmentation accuracy by a significant margin. The source code is available at https://github.com/abhi4ssj/few-shot-segmentation.