肺出血(P-Hem)は複数の種で発生し、さまざまな原因が考えられます。ヘモジデリン含有量に基づく肺胞マクロファージの5層スコアリングシステムを使用した気管支肺胞洗浄液(BALF)の細胞診は、最も感度の高い診断方法と考えられています。馬、猫、人間のサンプルを含む74の細胞診全スライド画像(WSI)で構成される、完全に注釈が付けられた新しい複数種のP-Hemデータセットを紹介します。この高品質で大量のデータセットを作成するために、人間の専門知識と深層学習およびデータ視覚化技術を組み合わせた注釈パイプラインを開発しました。専門的に注釈が付けられた17頭の馬のWSIでトレーニングされた深層学習ベースのオブジェクト検出アプローチを、残りの39頭の馬、12頭の人間、7頭の猫のWSIに適用しました。結果として得られた注釈は、複数のタイプの特殊な注釈マップでエラーがないか半自動的にスクリーニングされ、最終的に訓練を受けた病理学者によってレビューされました。私たちのデータセットには、5つのグレードに分類された合計297,383のヘモシデロファージが含まれています。これは、注釈の数、スキャンされた領域、および対象となる種の数に関して、公開されている最大のWSIデータセットの1つです。
Pulmonary hemorrhage (P-Hem) occurs among multiple species and can have various causes. Cytology of bronchoalveolarlavage fluid (BALF) using a 5-tier scoring system of alveolar macrophages based on their hemosiderin content is considered the most sensitive diagnostic method. We introduce a novel, fully annotated multi-species P-Hem dataset which consists of 74 cytology whole slide images (WSIs) with equine, feline and human samples. To create this high-quality and high-quantity dataset, we developed an annotation pipeline combining human expertise with deep learning and data visualisation techniques. We applied a deep learning-based object detection approach trained on 17 expertly annotated equine WSIs, to the remaining 39 equine, 12 human and 7 feline WSIs. The resulting annotations were semi-automatically screened for errors on multiple types of specialised annotation maps and finally reviewed by a trained pathologists. Our dataset contains a total of 297,383 hemosiderophages classified into five grades. It is one of the largest publicly availableWSIs datasets with respect to the number of annotations, the scanned area and the number of species covered.