自動医療画像セグメンテーションは、科学研究と医療において重要な役割を果たします。既存の高性能ディープラーニング手法は、通常、高品質の手動注釈付きの大規模なトレーニングデータセットに依存しています。これは、多くの臨床アプリケーションで取得するのが困難です。ここでは、不完全なトレーニングデータセットを処理するためのオープンソースフレームワークである、注釈効率の高いディープラーニング(AIDE)を紹介します。方法論的分析と経験的評価が行われ、AIDEが、希少またはノイズの多い注釈を持つオープンデータセットでより優れたパフォーマンスを提示することにより、従来の完全教師ありモデルを上回っていることを示します。さらに、乳房腫瘍のセグメンテーションに関する実際のケーススタディでAIDEをテストします。 3つの医療センターからの11,852の乳房画像を含む3つのデータセットが採用され、AIDEは10%のトレーニング注釈を利用して、完全に監視されたカウンターパートによって生成された、または独立した放射線科医によって提供されたものに匹敵するセグメンテーションマップを一貫して生成します。エキスパートラベルを利用する際の10倍に強化された効率は、幅広い生物医学的アプリケーションを促進する可能性を秘めています。
Automatic medical image segmentation plays a critical role in scientific research and medical care. Existing high-performance deep learning methods typically rely on large training datasets with high-quality manual annotations, which are difficult to obtain in many clinical applications. Here, we introduce Annotation-effIcient Deep lEarning (AIDE), an open-source framework to handle imperfect training datasets. Methodological analyses and empirical evaluations are conducted, and we demonstrate that AIDE surpasses conventional fully-supervised models by presenting better performance on open datasets possessing scarce or noisy annotations. We further test AIDE in a real-life case study for breast tumor segmentation. Three datasets containing 11,852 breast images from three medical centers are employed, and AIDE, utilizing 10% training annotations, consistently produces segmentation maps comparable to those generated by fully-supervised counterparts or provided by independent radiologists. The 10-fold enhanced efficiency in utilizing expert labels has the potential to promote a wide range of biomedical applications.