arXiv reaDer
ディープラーニングを使用したマルチスケールの意味的および空間的特徴に基づく効率的な頸部全スライド画像分析フレームワーク
An Efficient Cervical Whole Slide Image Analysis Framework Based on Multi-scale Semantic and Spatial Features using Deep Learning
デジタルギガピクセルの全スライド画像(WSI)は臨床診断で広く使用されており、自動化されたWSI分析はコンピューター支援診断の鍵となります。現在、ResNet分類器によってエンコードされた大規模なローカルパッチからの確率または特徴マップの統合記述子を分析することが、WSIレベルの予測の主な方法です。ただし、頸部スライドのまばらで小さな病変細胞の特徴表現は、プロモートが不十分な上流エンコーダーにとっては依然として挑戦的ですが、頸部細胞の未使用の空間表現は、セマンティクス分析を提供するために利用可能な特徴です。オーバーラップと反復処理を伴うパッチサンプリングだけでなく、非効率性と予測できない副作用が発生します。この研究では、マルチスケール接続を強化して、空間情報の追加監視を備えたYou Only Look Cytopathology Once(YOLCO)という名前の軽量モデルを構築することにより、新しいインライン接続ネットワーク(InCNet)を設計します。提案されたモデルでは、入力サイズをメガピクセルに拡大し、2つのスケールで特徴と予測を収集するために、平均繰り返しを10 ^ 3〜10 ^ 4から10 ^ 1〜10 ^ 2に減らしてWSIをオーバーラップせずにステッチできます。統合されたマルチスケールマルチタスク機能を分類するためのTransformerに基づくと、実験結果は、4つのスキャンデバイスからの2,019枚のスライドのマルチコホートデータセットでのWSI分類における従来の最良の方法よりも0.872 AUCスコアが高く、2.51倍速いようです。
Digital gigapixel whole slide image (WSI) is widely used in clinical diagnosis, and automated WSI analysis is key for computer-aided diagnosis. Currently, analyzing the integrated descriptor of probabilities or feature maps from massive local patches encoded by ResNet classifier is the main manner for WSI-level prediction. Feature representations of the sparse and tiny lesion cells in cervical slides, however, are still challengeable for the under-promoted upstream encoders, while the unused spatial representations of cervical cells are the available features to supply the semantics analysis. As well as patches sampling with overlap and repetitive processing incur the inefficiency and the unpredictable side effect. This study designs a novel inline connection network (InCNet) by enriching the multi-scale connectivity to build the lightweight model named You Only Look Cytopathology Once (YOLCO) with the additional supervision of spatial information. The proposed model allows the input size enlarged to megapixel that can stitch the WSI without any overlap by the average repeats decreased from 10^3∼10^4 to 10^1∼10^2 for collecting features and predictions at two scales. Based on Transformer for classifying the integrated multi-scale multi-task features, the experimental results appear 0.872 AUC score better and 2.51× faster than the best conventional method in WSI classification on multicohort datasets of 2,019 slides from four scanning devices.
updated: Tue Jun 29 2021 06:24:55 GMT+0000 (UTC)
published: Tue Jun 29 2021 06:24:55 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト