Segment Anything Model (SAM) は汎用画像のセマンティック セグメンテーションには優れていますが、医療画像に適用するとパフォーマンスが大幅に低下します。これは主に、トレーニング データセット内の医療画像の表現が不十分であることが原因です。それにもかかわらず、包括的なデータセットを収集し、普遍的に適用可能なモデルをトレーニングすることは、医療画像によく見られるロングテール問題のため、特に困難です。このギャップに対処するために、ここでは、少数ショットの医用画像セグメンテーションのためのセルフ サンプリング メタ SAM (SSM-SAM) フレームワークを紹介します。私たちのイノベーションは、次の 3 つの主要なモジュールの設計にあります。 1) オンライン高速勾配降下オプティマイザー。メタ学習器によってさらに最適化され、新しいタスクへの迅速かつ堅牢な適応を保証します。 2) セルフサンプリングモジュールは、注意の配分を改善するために適切に調整された視覚的なプロンプトを提供するように設計されています。 3) 異なるスライス間の関係を捕捉するための医療用少数ショット学習用に特別に設計された堅牢なアテンションベースのデコーダ。一般的な腹部 CT データセットと MRI データセットに対する広範な実験により、提案された方法が少数ショット セグメンテーションにおいて最先端の方法と比較して大幅な改善を達成し、DSC に関して平均 10.21% と 1.80% の改善が得られることが実証されました。それぞれ。結論として、わずか 0.83 分で新しい臓器に適応する、インタラクティブな画像セグメンテーションにおける迅速なオンライン適応のための新しいアプローチを紹介します。コードは承認されれば GitHub で公開されます。
While the Segment Anything Model (SAM) excels in semantic segmentation for general-purpose images, its performance significantly deteriorates when applied to medical images, primarily attributable to insufficient representation of medical images in its training dataset. Nonetheless, gathering comprehensive datasets and training models that are universally applicable is particularly challenging due to the long-tail problem common in medical images. To address this gap, here we present a Self-Sampling Meta SAM (SSM-SAM) framework for few-shot medical image segmentation. Our innovation lies in the design of three key modules: 1) An online fast gradient descent optimizer, further optimized by a meta-learner, which ensures swift and robust adaptation to new tasks. 2) A Self-Sampling module designed to provide well-aligned visual prompts for improved attention allocation; and 3) A robust attention-based decoder specifically designed for medical few-shot learning to capture relationship between different slices. Extensive experiments on a popular abdominal CT dataset and an MRI dataset demonstrate that the proposed method achieves significant improvements over state-of-the-art methods in few-shot segmentation, with an average improvements of 10.21% and 1.80% in terms of DSC, respectively. In conclusion, we present a novel approach for rapid online adaptation in interactive image segmentation, adapting to a new organ in just 0.83 minutes. Code is publicly available on GitHub upon acceptance.