プロンプトの柔軟性により、基礎モデルは自然言語処理と画像生成の分野で有力な存在となっています。最近のセグメント エニシング モデル (SAM) の導入により、プロンプト駆動型のパラダイムが画像セグメンテーションの領域に入り、これまでに知られていないさまざまな機能がもたらされました。ただし、自然画像と医療画像には大きな違いがあるため、医療画像のセグメンテーションに適用できるかどうかは依然として不明です。この研究では、SAM の成功を医療画像のセグメンテーション タスクに拡張するための最近の取り組みを要約します。および方法論的な適応について説明し、医療画像セグメンテーションにおける SAM の将来の可能性について議論します。 SAM を医用画像セグメンテーションに直接適用しても、マルチモーダルおよびマルチターゲットの医療データセットでは満足のいくパフォーマンスを得ることができませんが、医用画像解析の基礎モデルを開発する将来の研究の指針となる多くの洞察が得られます。将来の研究を促進するために、最新の論文リストとオープンソース プロジェクトの概要を含むアクティブなリポジトリを https://github.com/YichiZhang98/SAM4MIS で維持しています。
Due to the flexibility of prompting, foundation models have become the dominant force in the domains of natural language processing and image generation. With the recent introduction of the Segment Anything Model (SAM), the prompt-driven paradigm has entered the realm of image segmentation, bringing with a range of previously unexplored capabilities. However, it remains unclear whether it can be applicable to medical image segmentation due to the significant differences between natural images and medical images.In this work, we summarize recent efforts to extend the success of SAM to medical image segmentation tasks, including both empirical benchmarking and methodological adaptations, and discuss potential future directions for SAM in medical image segmentation. Although directly applying SAM to medical image segmentation cannot obtain satisfying performance on multi-modal and multi-target medical datasets, many insights are drawn to guide future research to develop foundation models for medical image analysis. To facilitate future research, we maintain an active repository that contains up-to-date paper list and open-source project summary at https://github.com/YichiZhang98/SAM4MIS.