arXiv reaDer
臨床グレードのパフォーマンスを備えた病理学的人工知能のデータの準備
Preparing data for pathological artificial intelligence with clinical-grade performance
[目的]病理学は病気の診断に決定的ですが、経験豊富な病理医に大きく依存しています。最近、病理学的人工知能(PAI)は、診断の精度と効率を向上させると考えられています。ただし、実験室での深層学習に基づくPAIの高性能は、一般的に診療所では再現できません。 【方法】PAIにとってデータの準備が重要であるため、2017年1月から2022年2月までに公開されたPubMedデータベースのPAI関連の研究をレビューし、118の研究が含まれた。病理組織のスライドの取得、洗浄、スクリーニング、デジタル化など、データを準備する方法の詳細な分析が実行されます。専門家によるレビュー、画像の注釈、モデルのトレーニングと検証のためのデータセットの分割についても説明します。さらに、PAIの高性能が臨床診療で再現できない理由について説明し、PAIの臨床性能を改善するためのいくつかの効果的な方法を示します。 [結果]PAIの堅牢性は、厳密な品質管理とスクリーニング、デジタルの不一致の修正、妥当な注釈、データ量など、代表的な疾患スライドのランダムな収集に依存します。デジタルパソロジーは臨床グレードのPAIの基本であり、データ標準化の手法と全スライド画像(WSI)に基づく弱教師あり学習法は、パフォーマンス再現の障害を克服するための効果的な方法です。 【結論】代表的なデータ、多施設からのラベリングの量と一貫性がパフォーマンス再現の鍵です。臨床診断、データ標準化、およびWSIベースの弱教師あり学習の技術のためのデジタル病理学は、臨床グレードのPAIを構築することを願っています。キーワード:病理学的人工知能;データの準備;臨床グレード;ディープラーニング
[Purpose] The pathology is decisive for disease diagnosis, but relies heavily on the experienced pathologists. Recently, pathological artificial intelligence (PAI) is thought to improve diagnostic accuracy and efficiency. However, the high performance of PAI based on deep learning in the laboratory generally cannot be reproduced in the clinic. [Methods] Because the data preparation is important for PAI, the paper has reviewed PAI-related studies in the PubMed database published from January 2017 to February 2022, and 118 studies were included. The in-depth analysis of methods for preparing data is performed, including obtaining slides of pathological tissue, cleaning, screening, and then digitizing. Expert review, image annotation, dataset division for model training and validation are also discussed. We further discuss the reasons why the high performance of PAI is not reproducible in the clinical practices and show some effective ways to improve clinical performances of PAI. [Results] The robustness of PAI depend on randomized collection of representative disease slides, including rigorous quality control and screening, correction of digital discrepancies, reasonable annotation, and the amount of data. The digital pathology is fundamental of clinical-grade PAI, and the techniques of data standardization and weakly supervised learning methods based on whole slide image (WSI) are effective ways to overcome obstacles of performance reproduction. [Conclusion] The representative data, the amount of labeling and consistency from multi-centers is the key to performance reproduction. The digital pathology for clinical diagnosis, data standardization and technique of WSI-based weakly supervised learning hopefully build clinical-grade PAI. Keywords: pathological artificial intelligence; data preparation; clinical-grade; deep learning
updated: Sun May 22 2022 05:20:41 GMT+0000 (UTC)
published: Sun May 22 2022 05:20:41 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト