arXiv reaDer
構造化されたデータセットのドキュメント:CheXpertのデータシート
Structured dataset documentation: a datasheet for CheXpert
毎年、世界中で何十億ものX線画像が撮影されています。機械学習、特にディープラーニングは、放射線科医が画像をトリアージして診断するのに役立つ可能性を示しています。ただし、ディープラーニングには、信頼できるラベルが付いた大規模なデータセットが必要です。 CheXpertデータセットは、理事会認定の放射線科医の参加を得て作成されたため、ディープラーニングネットワークのトレーニングに必要な強力なグラウンドトゥルースが得られました。データセットのデータセットの構造化された形式に従って、このペーパーは元のCheXpertペーパーおよびその他のソースを拡張して、信頼できるラベルの作成において放射線科医が果たす重要な役割を示し、データセット構成のさまざまな側面を詳細に説明します。このような構造化されたドキュメントは、機械学習と医療コミュニティでCheXpertの長所、アプリケーション、進化についての認識を高め、それによって医療画像分析の分野を前進させることを目的としています。このホワイトペーパーのもう1つの目的は、データセットの詳細で構造化された説明を作成する方法のコミュニティに、このデータセットデータシートを例として提示することです。データセットの作成プロセス、コンテンツ、およびアプリケーションを明確に文書化することで、有用で信頼性の高いモデルの作成が加速されると確信しています。
Billions of X-ray images are taken worldwide each year. Machine learning, and deep learning in particular, has shown potential to help radiologists triage and diagnose images. However, deep learning requires large datasets with reliable labels. The CheXpert dataset was created with the participation of board-certified radiologists, resulting in the strong ground truth needed to train deep learning networks. Following the structured format of Datasheets for Datasets, this paper expands on the original CheXpert paper and other sources to show the critical role played by radiologists in the creation of reliable labels and to describe the different aspects of the dataset composition in detail. Such structured documentation intends to increase the awareness in the machine learning and medical communities of the strengths, applications, and evolution of CheXpert, thereby advancing the field of medical image analysis. Another objective of this paper is to put forward this dataset datasheet as an example to the community of how to create detailed and structured descriptions of datasets. We believe that clearly documenting the creation process, the contents, and applications of datasets accelerates the creation of useful and reliable models.
updated: Fri May 07 2021 00:45:03 GMT+0000 (UTC)
published: Fri May 07 2021 00:45:03 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト