Segment Anything Model (SAM) は、最近、画像セグメンテーションの分野で人気を博しています。 SAM は、オールラウンドなセグメンテーション タスクにおける印象的な機能とプロンプト ベースのインターフェイスのおかげで、コミュニティ内で集中的な議論を巻き起こしました。多くの著名な専門家は、画像セグメンテーション タスクが SAM によって「終了」したとさえ言っています。ただし、医用画像のセグメンテーションは、画像セグメンテーション ファミリーの重要な分野ですが、セグメンテーション「何でも」の範囲には含まれていないようです。多くの個々の実験と最近の研究は、SAM が医用画像セグメンテーションで標準以下の性能を発揮することを示しています。 SAM の強力なセグメンテーション機能を医用画像セグメンテーションに拡張するには、パズルの欠けているピースをどのように見つけるかという疑問が自然に生じます。このホワイト ペーパーでは、アダプターを使用したパラメーター効率の高い微調整パラダイムに従って、事前トレーニング済みの SAM モデルを微調整することにより、可能な解決策を提示します。この作業は、人気のある NLP 手法の Adapter をコンピューター ビジョンのケースに移植する数少ない作業の 1 つですが、この単純な実装は、医療用画像のセグメンテーションで驚くほど優れたパフォーマンスを示します。私たちが Medical SAM Adapter (MSA) と呼んでいる医用画像適応 SAM は、CT、MRI、超音波画像、眼底画像、およびダーモスコープ画像を含むさまざまな画像モダリティを使用した 19 の医用画像セグメンテーション タスクで優れたパフォーマンスを示します。 MSA は、nnUNet、TransUNet、UNetr、MedSegDiff などの幅広い最先端 (SOTA) の医用画像セグメンテーション方法よりも優れています。コードは https://github.com/WuJunde/Medical-SAM-Adapter でリリースされます。
The Segment Anything Model (SAM) has recently gained popularity in the field of image segmentation. Thanks to its impressive capabilities in all-round segmentation tasks and its prompt-based interface, SAM has sparked intensive discussion within the community. It is even said by many prestigious experts that image segmentation task has been "finished" by SAM. However, medical image segmentation, although an important branch of the image segmentation family, seems not to be included in the scope of Segmenting "Anything". Many individual experiments and recent studies have shown that SAM performs subpar in medical image segmentation. A natural question is how to find the missing piece of the puzzle to extend the strong segmentation capability of SAM to medical image segmentation. In this paper, we present a possible solution by fine-tuning the pretrained SAM model following parameter-efficient fine-tuning paradigm with Adapter. Although this work is still one of a few to transfer the popular NLP technique Adapter to computer vision cases, this simple implementation shows surprisingly good performance on medical image segmentation. A medical image adapted SAM, which we have dubbed Medical SAM Adapter (MSA), shows superior performance on 19 medical image segmentation tasks with various image modalities including CT, MRI, ultrasound image, fundus image, and dermoscopic images. MSA outperforms a wide range of state-of-the-art (SOTA) medical image segmentation methods, such as nnUNet, TransUNet, UNetr, MedSegDiff, and so on. Code will be released at: https://github.com/WuJunde/Medical-SAM-Adapter.