医用画像には、画像(ベンダー、取得パラメーター)と患者(疾患の種類または重症度、人口統計、ゲノミクス)を説明するメタデータが付随していることがよくあります。このメタデータは通常、画像セグメンテーション方法では無視されます。この作業では、画像セグメンテーションタスクにFiLM(Feature-wise Linear Modulation)と呼ばれる線形調整方法を採用します。このFiLMの適応により、メタデータをセグメンテーションモデルに統合して、パフォーマンスを向上させることができます。腫瘍タイプをFiLMに組み込んだ場合、脊髄腫瘍セグメンテーションで平均ダイススコアが5.1%増加することが観察されました。メタデータは、ニューラルネットワークのアーキテクチャに含めることができるフィーチャマップに適用される低コストのアフィン変換を通じて、セグメンテーションプロセスを調整します。さらに、医用画像の一般的な課題に取り組むためのセグメンテーションFiLMレイヤーの関連性を評価します:限られた数または不均衡な数の注釈付きデータを使用したトレーニング、セグメンテーションが欠落しているマルチクラストレーニング、および複数のタスクへのモデルの適応。私たちの結果は、セグメンテーションに対するFiLMの次の利点を示しています。FiLMedU-Netは、ラベルの欠落に対して堅牢であり、シングルタスクU-Netと比較してラベルが少ない(最大16.7%)高いダイススコアに達しました。コードはオープンソースであり、www.ivadomed.orgで入手できます。
Medical images are often accompanied by metadata describing the image (vendor, acquisition parameters) and the patient (disease type or severity, demographics, genomics). This metadata is usually disregarded by image segmentation methods. In this work, we adapt a linear conditioning method called FiLM (Feature-wise Linear Modulation) for image segmentation tasks. This FiLM adaptation enables integrating metadata into segmentation models for better performance. We observed an average Dice score increase of 5.1% on spinal cord tumor segmentation when incorporating the tumor type with FiLM. The metadata modulates the segmentation process through low-cost affine transformations applied on feature maps which can be included in any neural network's architecture. Additionally, we assess the relevance of segmentation FiLM layers for tackling common challenges in medical imaging: training with limited or unbalanced number of annotated data, multi-class training with missing segmentations, and model adaptation to multiple tasks. Our results demonstrated the following benefits of FiLM for segmentation: FiLMed U-Net was robust to missing labels and reached higher Dice scores with few labels (up to 16.7%) compared to single-task U-Net. The code is open-source and available at www.ivadomed.org.