arXiv reaDer
医用画像解析のためのあらゆるモデルのセグメント化: 実験的研究
Segment Anything Model for Medical Image Analysis: an Experimental Study
医用画像のセグメンテーション モデルのトレーニングは、データ アノテーションの利用可能性と取得費用が限られているため、依然として困難です。 Segment Anything Model (SAM) は、主に自然画像用の 10 億を超えるアノテーションでトレーニングされた基本モデルであり、ユーザー定義の対象オブジェクトをインタラクティブな方法でセグメント化できるようにすることを目的としています。自然画像での印象的なパフォーマンスにもかかわらず、医療画像ドメインに移行したときにモデルがどのように影響を受けるかは不明です。ここでは、さまざまなモダリティと解剖学からの 11 の医用画像データセットのコレクションで医用画像をセグメント化する SAM の機能の広範な評価を実行します。私たちの実験では、インタラクティブなセグメンテーションをシミュレートする標準的な方法を使用してポイント プロンプトを生成しました。実験結果によると、単一のプロンプトに基づく SAM のパフォーマンスは、タスクとデータセットによって大きく異なります。つまり、脊椎 MRI データセットの 0.1135 から股関節 X 線データセットの 0.8650 まで、IoU によって評価されます。パフォーマンスは、明確なプロンプトを備えた十分に囲まれたオブジェクトを含むタスクでは高く、腫瘍のセグメンテーションなどの他の多くのシナリオでは劣っているように見えます。複数のプロンプトが提供された場合、パフォーマンスは全体的にわずかに向上しますが、オブジェクトが連続していないデータセットではさらに向上します。 RITM との追加の比較では、1 つのプロンプトに対しては SAM のパフォーマンスの方がはるかに優れていることが示されましたが、より多くのプロンプトに対しては 2 つの方法のパフォーマンスが同様でした。 SAM は、ゼロ ショット学習のセットアップを考えると、一部のデータセットでは印象的なパフォーマンスを示しますが、他の複数のデータセットではパフォーマンスが低下または中程度であると結論付けています。モデルおよび学習パラダイムとしての SAM は、医用画像領域に影響を与える可能性がありますが、この領域に適応させる適切な方法を特定するには、広範な研究が必要です。
Training segmentation models for medical images continues to be challenging due to the limited availability and acquisition expense of data annotations. Segment Anything Model (SAM) is a foundation model trained on over 1 billion annotations, predominantly for natural images, that is intended to be able to segment the user-defined object of interest in an interactive manner. Despite its impressive performance on natural images, it is unclear how the model is affected when shifting to medical image domains. Here, we perform an extensive evaluation of SAM's ability to segment medical images on a collection of 11 medical imaging datasets from various modalities and anatomies. In our experiments, we generated point prompts using a standard method that simulates interactive segmentation. Experimental results show that SAM's performance based on single prompts highly varies depending on the task and the dataset, i.e., from 0.1135 for a spine MRI dataset to 0.8650 for a hip x-ray dataset, evaluated by IoU. Performance appears to be high for tasks including well-circumscribed objects with unambiguous prompts and poorer in many other scenarios such as segmentation of tumors. When multiple prompts are provided, performance improves only slightly overall, but more so for datasets where the object is not contiguous. An additional comparison to RITM showed a much better performance of SAM for one prompt but a similar performance of the two methods for a larger number of prompts. We conclude that SAM shows impressive performance for some datasets given the zero-shot learning setup but poor to moderate performance for multiple other datasets. While SAM as a model and as a learning paradigm might be impactful in the medical imaging domain, extensive research is needed to identify the proper ways of adapting it in this domain.
updated: Thu Apr 20 2023 17:50:18 GMT+0000 (UTC)
published: Thu Apr 20 2023 17:50:18 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト