arXiv reaDer
マウス腎臓のテラバイト規模の教師あり3Dトレーニングおよびベンチマークデータセット
Terabyte-scale supervised 3D training and benchmarking dataset of the mouse kidney
3D生物医学画像のセグメンテーションに使用される機械学習アルゴリズムのパフォーマンスは、2D写真の分類に使用されるアルゴリズムのパフォーマンスよりも遅れています。これは、最先端の画像処理施設、注釈用のドメインエキスパート、作成するための大規模な計算リソースと個人リソースを必要とする、大量で高品質のトレーニングデータセットが比較的不足していることで説明できます。この作業で提示されたHR-Kidneyデータセットは、マウスの腎臓全体の1.7 TBのアーチファクト補正シンクロトロン放射ベースのX線位相コントラストマイクロトモグラフィー画像と、1〜2を表す33729糸球体の検証済みセグメンテーションを提供することによってこのギャップを埋めます。現在利用可能な生物医学データセットよりも桁違いに増加しています。データセットには、基礎となる生データ、腎血管系と尿細管の古典的なセグメンテーション、および真の3D手動注釈がさらに含まれています。小さなトレーニングデータセットによって現在課されている制限を取り除くことにより、提供されたデータは、生物医学画像分析のための機械学習の混乱の可能性を開きます。
The performance of machine learning algorithms used for the segmentation of 3D biomedical images lags behind that of the algorithms employed in the classification of 2D photos. This may be explained by the comparative lack of high-volume, high-quality training datasets, which require state-of-the art imaging facilities, domain experts for annotation and large computational and personal resources to create. The HR-Kidney dataset presented in this work bridges this gap by providing 1.7 TB of artefact-corrected synchrotron radiation-based X-ray phase-contrast microtomography images of whole mouse kidneys and validated segmentations of 33 729 glomeruli, which represents a 1-2 orders of magnitude increase over currently available biomedical datasets. The dataset further contains the underlying raw data, classical segmentations of renal vasculature and uriniferous tubules, as well as true 3D manual annotations. By removing limits currently imposed by small training datasets, the provided data open up the possibility for disruptions in machine learning for biomedical image analysis.
updated: Wed Aug 04 2021 18:08:28 GMT+0000 (UTC)
published: Wed Aug 04 2021 18:08:28 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト