arXiv reaDer
デジタルパソロジーにおける人工知能の診断テスト精度 (DTA): 体系的レビュー、メタ分析、品質評価
Diagnostic test accuracy (DTA) of artificial intelligence in digital pathology: a systematic review, meta-analysis and quality assessment
臨床使用前に AI モデルの診断パフォーマンスを保証することが、これらのテクノロジーの安全な導入と成功の鍵となります。診断目的でデジタル病理画像に AI を適用した研究を報告する研究が近年急速に増加しています。この研究の目的は、病理学のあらゆる分野のデジタル病理学画像における AI の診断精度の概要を提供することです。この系統的レビューとメタ分析には、あらゆる種類の疾患の全スライド画像 (WSI) に適用されるあらゆる種類の人工知能を使用した診断精度研究が含まれています。参照標準は、組織病理学的評価および/または免疫組織化学によって診断されました。検索は、2022 年 6 月に PubMed、EMBASE、および CENTRAL で実施されました。2976 件の研究を特定し、そのうち 100 件がレビューに含まれ、48 件が完全なメタ分析に含まれました。バイアスのリスクと適用可能性の懸念は、QUADAS-2 ツールを使用して評価されました。データ抽出は 2 人の研究者によって実行され、二変量ランダム効果モデルを使用してメタ分析が実行されました。 100 の研究が対象として特定され、これは 152,000 を超える全スライド画像 (WSI) に相当し、多くの疾患タイプを表しています。これらのうち、48 件の研究がメタ分析に含まれました。これらの研究では、AI に対する平均感度 96.3% (CI 94.1-97.7) および平均特異度 93.3% (CI 90.5-95.4) が報告されました。研究デザインには実質的な不均一性があり、含めるように特定された100件の研究すべてに、バイアスのリスクが高い、または不明瞭な領域が少なくとも1つありました。このレビューでは、スライド全体のイメージングにおけるアプリケーション全体の AI パフォーマンスの広範な概要を提供します。ただし、研究デザインや利用可能なパフォーマンスデータには大きなばらつきがあり、研究の実施やデータセットの構成に関する詳細が欠落していることがよくあります。全体として、AI は WSI に適用すると優れた精度を提供しますが、そのパフォーマンスについてはより厳密な評価が必要です。
Ensuring diagnostic performance of AI models before clinical use is key to the safe and successful adoption of these technologies. Studies reporting AI applied to digital pathology images for diagnostic purposes have rapidly increased in number in recent years. The aim of this work is to provide an overview of the diagnostic accuracy of AI in digital pathology images from all areas of pathology. This systematic review and meta-analysis included diagnostic accuracy studies using any type of artificial intelligence applied to whole slide images (WSIs) in any disease type. The reference standard was diagnosis through histopathological assessment and / or immunohistochemistry. Searches were conducted in PubMed, EMBASE and CENTRAL in June 2022. We identified 2976 studies, of which 100 were included in the review and 48 in the full meta-analysis. Risk of bias and concerns of applicability were assessed using the QUADAS-2 tool. Data extraction was conducted by two investigators and meta-analysis was performed using a bivariate random effects model. 100 studies were identified for inclusion, equating to over 152,000 whole slide images (WSIs) and representing many disease types. Of these, 48 studies were included in the meta-analysis. These studies reported a mean sensitivity of 96.3% (CI 94.1-97.7) and mean specificity of 93.3% (CI 90.5-95.4) for AI. There was substantial heterogeneity in study design and all 100 studies identified for inclusion had at least one area at high or unclear risk of bias. This review provides a broad overview of AI performance across applications in whole slide imaging. However, there is huge variability in study design and available performance data, with details around the conduct of the study and make up of the datasets frequently missing. Overall, AI offers good accuracy when applied to WSIs but requires more rigorous evaluation of its performance.
updated: Tue Jun 13 2023 00:45:54 GMT+0000 (UTC)
published: Tue Jun 13 2023 00:45:54 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト