医用画像の文献では、畳み込みニューラルネットワークに基づいた高性能なセグメンテーションモデルの顕著な進歩が目撃されています。新しいパフォーマンスの高さにもかかわらず、最近の高度なセグメンテーションモデルでは、大規模で代表的な高品質の注釈付きデータセットが必要です。ただし、完全なトレーニングデータセットが存在することはめったにありません。特に、医療画像の分野では、データと注釈の両方の取得に費用がかかります。最近、多くの研究が不完全なデータセットを使用した医療画像セグメンテーションの問題を調査し、2つの主要なデータセットの制限に取り組んでいます。注釈、または画像レベルの注釈。この記事では、上記のソリューションの詳細なレビューを提供し、技術的な新規性と経験的な結果の両方を要約します。さらに、調査した方法の利点と要件を比較し、推奨ソリューションを提供します。この調査記事が、不完全な医療画像セグメンテーションデータセットを処理するために利用可能な技術に対するコミュニティの意識を高めることを願っています。
The medical imaging literature has witnessed remarkable progress in high-performing segmentation models based on convolutional neural networks. Despite the new performance highs, the recent advanced segmentation models still require large, representative, and high quality annotated datasets. However, rarely do we have a perfect training dataset, particularly in the field of medical imaging, where data and annotations are both expensive to acquire. Recently, a large body of research has studied the problem of medical image segmentation with imperfect datasets, tackling two major dataset limitations: scarce annotations where only limited annotated data is available for training, and weak annotations where the training data has only sparse annotations, noisy annotations, or image-level annotations. In this article, we provide a detailed review of the solutions above, summarizing both the technical novelties and empirical results. We further compare the benefits and requirements of the surveyed methodologies and provide our recommended solutions. We hope this survey article increases the community awareness of the techniques that are available to handle imperfect medical image segmentation datasets.