To What Extent Does Downsampling, Compression, and Data Scarcity Impact Renal Image Analysis?
  腎直接免疫蛍光(DIF)検体の糸球体、またはフィルター袋の状態は、腎疾患を診断するための重要な指標です。ガラス組織学スライドをデジタル化して全スライド画像(WSI)にし、高倍率の対物レンズで糸球体を自動的に検出してズームインする病理学システムは、病理学者にとって非常に役立ちます。このホワイトペーパーでは、糸球体検出をスタディケースとして使用し、WSIを処理するコンピューター支援診断(CAD)システムの開発に役立ついくつかの重要な問題の分析と観察を提供します。大きな画像解像度、大きなファイルサイズ、およびデータ不足は、常に対処が困難です。この目的のために、まず検出精度への影響に関して画像のダウンサンプリング率を調べます。次に、画像圧縮の影響を調べます。第三に、トレーニングセットのサイズと検出精度の関係を調べます。上記の問題を理解するために、最先端の検出器である、より高速なR-CNN、R-FCN、マスクR-CNNおよびSSDで実験が行われます。重要な調査結果が観察されます。(1)検出精度、検出速度、およびファイルサイズの最適なバランスは、$ 40 \ times $対物レンズでキャプチャされた8回のダウンサンプリングで達成されます。 (2)ファイルサイズを大幅に縮小する圧縮は、全体的な精度に必ずしも悪影響を与えるわけではありません。 (3)トレーニングデータの量をある程度減らすと、精度が低下しますが、リコールにはほとんど影響しません。 (4)ほとんどの場合、高速R-CNNは糸球体検出タスクで最高の精度を達成します。 $ 40 \ times $ WSI画像の画像ファイルサイズは、糸球体の検出精度をほとんど損なうことなく、6000倍以上に縮小できることを示しています。
The condition of the Glomeruli, or filter sacks, in renal Direct Immunofluorescence (DIF) specimens is a critical indicator for diagnosing kidney diseases. A digital pathology system which digitizes a glass histology slide into a Whole Slide Image (WSI) and then automatically detects and zooms in on the glomeruli with a higher magnification objective will be extremely helpful for pathologists. In this paper, using glomerulus detection as the study case, we provide analysis and observations on several important issues to help with the development of Computer Aided Diagnostic (CAD) systems to process WSIs. Large image resolution, large file size, and data scarcity are always challenging to deal with. To this end, we first examine image downsampling rates in terms of their effect on detection accuracy. Second, we examine the impact of image compression. Third, we examine the relationship between the size of the training set and detection accuracy. To understand the above issues, experiments are performed on the state-of-the-art detectors: Faster R-CNN, R-FCN, Mask R-CNN and SSD. Critical findings are observed: (1) The best balance between detection accuracy, detection speed and file size is achieved at 8 times downsampling captured with a $40\times$ objective; (2) compression which reduces the file size dramatically, does not necessarily have an adverse effect on overall accuracy; (3) reducing the amount of training data to some extents causes a drop in precision but has a negligible impact on the recall; (4) in most cases, Faster R-CNN achieves the best accuracy in the glomerulus detection task. We show that the image file size of $40\times$ WSI images can be reduced by a factor of over 6000 with negligible loss of glomerulus detection accuracy.
