arXiv reaDer
医療セグメンテーション十種競技
The Medical Segmentation Decathlon
国際的な課題は、特定のタスクが与えられた場合の画像分析アルゴリズムの比較評価の事実上の標準になっています。セグメンテーションはこれまでで最も広く調査されている医用画像処理タスクですが、アルゴリズム開発は単一の特定の臨床問題に取り組む必要性によって推進されたため、さまざまなセグメンテーションの課題は通常、個別に編成されてきました。複数のタスクで適切に実行できる方法は、これまでに見られなかったタスクに適切に一般化され、カスタム設計のソリューションよりもパフォーマンスが向上する可能性があると仮定しました。仮説を調査するために、医療セグメンテーション十種競技(MSD)を組織しました。これは、アルゴリズムが多数のタスクとモダリティの両方で競合する生物医学画像分析の課題です。基礎となるデータセットは、小さなデータセット、不均衡なラベル、マルチサイトデータ、小さなオブジェクトなど、医用画像を処理するときに通常遭遇する困難の軸を調査するように設計されました。 MSDチャレンジにより、一連のタスクで一貫して良好なパフォーマンスを発揮するアルゴリズムが、これまでに見られなかった別の一連のタスクで良好な平均パフォーマンスを維持していることが確認されました。さらに、MSDの勝者を2年間監視することにより、このアルゴリズムが他のさまざまな臨床問題に十分に一般化され続けていることがわかり、仮説がさらに確認されました。この研究から、3つの主要な結論を導き出すことができます。(1)最先端の画像セグメンテーションアルゴリズムは成熟しており、正確であり、目に見えないタスクで再トレーニングすると一般化されます。 (2) 複数のタスクにわたる一貫したアルゴリズムのパフォーマンスは、アルゴリズムの一般化可能性の強力な代用です。 (3)正確なAIセグメンテーションモデルのトレーニングは、AI以外の専門家にコモディティ化されました。
International challenges have become the de facto standard for comparative assessment of image analysis algorithms given a specific task. Segmentation is so far the most widely investigated medical image processing task, but the various segmentation challenges have typically been organized in isolation, such that algorithm development was driven by the need to tackle a single specific clinical problem. We hypothesized that a method capable of performing well on multiple tasks will generalize well to a previously unseen task and potentially outperform a custom-designed solution. To investigate the hypothesis, we organized the Medical Segmentation Decathlon (MSD) - a biomedical image analysis challenge, in which algorithms compete in a multitude of both tasks and modalities. The underlying data set was designed to explore the axis of difficulties typically encountered when dealing with medical images, such as small data sets, unbalanced labels, multi-site data and small objects. The MSD challenge confirmed that algorithms with a consistent good performance on a set of tasks preserved their good average performance on a different set of previously unseen tasks. Moreover, by monitoring the MSD winner for two years, we found that this algorithm continued generalizing well to a wide range of other clinical problems, further confirming our hypothesis. Three main conclusions can be drawn from this study: (1) state-of-the-art image segmentation algorithms are mature, accurate, and generalize well when retrained on unseen tasks; (2) consistent algorithmic performance across multiple tasks is a strong surrogate of algorithmic generalizability; (3) the training of accurate AI segmentation models is now commoditized to non AI experts.
updated: Thu Jun 10 2021 13:34:06 GMT+0000 (UTC)
published: Thu Jun 10 2021 13:34:06 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト