arXiv reaDer
汎がん腹部臓器定量化におけるラベルなしデータの強みを解き放つ: FLARE22 チャレンジ
Unleashing the Strengths of Unlabeled Data in Pan-cancer Abdominal Organ Quantification: the FLARE22 Challenge
定量的な臓器評価は、腹部疾患の自動診断と治療計画において不可欠なステップです。人工知能 (AI) は、このプロセスを自動化する大きな可能性を示しています。しかし、既存の AI アルゴリズムのほとんどは多くの専門家の注釈に依存しており、現実世界の多国籍環境における精度と効率の包括的な評価が不足しています。これらの制限を克服するために、私たちはこれまでで最大の腹部臓器解析チャレンジである FLARE 2022 チャレンジを組織し、高速、低リソース、正確、アノテーション効率の高い汎用 AI アルゴリズムのベンチマークを行いました。私たちは、さまざまな人種、疾患、フェーズ、メーカーのコンピューター断層撮影 (CT) スキャンを含む、50 を超える医療グループから大陸間および多国籍のデータセットを構築しました。私たちは、50 回のラベル付きスキャンと 2000 回のラベルなしスキャンを使用して、一連の AI アルゴリズムがダイス類似係数 (DSC) の中央値 90.0% を達成したことを独自に検証しました。これにより、アノテーション要件が大幅に軽減されます。最もパフォーマンスの高いアルゴリズムは、外部検証セットを押しのける一般化に成功し、北米、ヨーロッパ、アジアのコホートでそれぞれ 89.5%、90.9%、88.3% の DSC 中央値を達成しました。また、従来の手動測定では労働集約的であった主要な臓器生物学的特徴の自動抽出も可能になりました。これにより、ラベルのないデータを使用してパフォーマンスを向上させ、最新の AI モデルの注釈不足を軽減できる可能性が開かれます。
Quantitative organ assessment is an essential step in automated abdominal disease diagnosis and treatment planning. Artificial intelligence (AI) has shown great potential to automatize this process. However, most existing AI algorithms rely on many expert annotations and lack a comprehensive evaluation of accuracy and efficiency in real-world multinational settings. To overcome these limitations, we organized the FLARE 2022 Challenge, the largest abdominal organ analysis challenge to date, to benchmark fast, low-resource, accurate, annotation-efficient, and generalized AI algorithms. We constructed an intercontinental and multinational dataset from more than 50 medical groups, including Computed Tomography (CT) scans with different races, diseases, phases, and manufacturers. We independently validated that a set of AI algorithms achieved a median Dice Similarity Coefficient (DSC) of 90.0% by using 50 labeled scans and 2000 unlabeled scans, which can significantly reduce annotation requirements. The best-performing algorithms successfully generalized to holdout external validation sets, achieving a median DSC of 89.5%, 90.9%, and 88.3% on North American, European, and Asian cohorts, respectively. They also enabled automatic extraction of key organ biology features, which was labor-intensive with traditional manual measurements. This opens the potential to use unlabeled data to boost performance and alleviate annotation shortages for modern AI models.
updated: Thu Aug 10 2023 21:51:48 GMT+0000 (UTC)
published: Thu Aug 10 2023 21:51:48 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト