この論文では、医療画像に関する最近のセグメント エニシング モデル (SAM) を検証し、光干渉断層撮影 (OCT) などのさまざまなイメージング モダリティをカバーする 9 つの医療画像セグメンテーション ベンチマークに関する定量的および定性的なゼロショット セグメンテーションの結果を報告します。磁気共鳴画像法 (MRI)、コンピューター断層撮影法 (CT) だけでなく、皮膚科、眼科、放射線科などのさまざまな用途にも使用できます。これらのベンチマークは代表的なものであり、モデル開発で一般的に使用されます。私たちの実験結果は、SAM が一般領域の画像に対して顕著なセグメンテーション パフォーマンスを示す一方で、そのゼロショット セグメンテーション能力は、配布外の画像 (医療画像など) に対しては制限されたままであることを示しています。さらに、SAM は、さまざまな目に見えない医療領域にわたって一貫性のないゼロショット セグメンテーションのパフォーマンスを示します。血管などの特定の構造化されたターゲットでは、SAM のゼロショット セグメンテーションは完全に失敗しました。対照的に、少量のデータで簡単に微調整すると、セグメンテーションの品質が大幅に向上する可能性があり、微調整された SAM を使用して高精度の診断のための正確な医用画像のセグメンテーションを実現することの大きな可能性と実現可能性が示されています。私たちの研究は、医療画像に関するジェネラリスト視覚基盤モデルの多用途性と、微調整を通じて望ましいパフォーマンスを達成し、最終的には臨床診断をサポートする大規模で多様な医療データセットへのアクセスに関連する課題に対処できる大きな可能性を示しています。
In this paper, we examine the recent Segment Anything Model (SAM) on medical images, and report both quantitative and qualitative zero-shot segmentation results on nine medical image segmentation benchmarks, covering various imaging modalities, such as optical coherence tomography (OCT), magnetic resonance imaging (MRI), and computed tomography (CT), as well as different applications including dermatology, ophthalmology, and radiology. Those benchmarks are representative and commonly used in model development. Our experimental results indicate that while SAM presents remarkable segmentation performance on images from the general domain, its zero-shot segmentation ability remains restricted for out-of-distribution images, e.g., medical images. In addition, SAM exhibits inconsistent zero-shot segmentation performance across different unseen medical domains. For certain structured targets, e.g., blood vessels, the zero-shot segmentation of SAM completely failed. In contrast, a simple fine-tuning of it with a small amount of data could lead to remarkable improvement of the segmentation quality, showing the great potential and feasibility of using fine-tuned SAM to achieve accurate medical image segmentation for a precision diagnostics. Our study indicates the versatility of generalist vision foundation models on medical imaging, and their great potential to achieve desired performance through fine-turning and eventually address the challenges associated with accessing large and diverse medical datasets in support of clinical diagnostics.