COVID-19 のパンデミックが始まってから 2 年以上が経過しましたが、この危機の圧力は世界中で壊滅的な打撃を受け続けています。 RT-PCR 検査を補完するスクリーニング戦略としての胸部 X 線 (CXR) 画像の使用は、一般的であるだけでなく、呼吸器疾患に対する日常的な臨床使用のために大幅に増加しています。これまで、CXR イメージングに基づく COVID-19 スクリーニング用に多くの視覚認識モデルが提案されてきました。それにもかかわらず、これらのモデルの精度と一般化能力は、トレーニングされたデータセットの多様性とサイズに大きく依存します。これに動機付けられて、COVID-19 コンピューター ビジョン研究をサポートするための CXR 画像の大規模なベンチマーク データセットである COVIDx CXR-3 を紹介します。 COVIDx CXR-3 は、少なくとも 51 か国の 17,026 人の患者からなる多国籍コホートからの 30,386 枚の CXR 画像で構成されており、私たちの知る限りでは、最も広範で最も多様な COVID-19 CXR データセットをオープンアクセス形式で作成しています。ここでは、患者の人口統計、画像ビュー、感染の種類など、提案されたデータセットのさまざまな側面に関する包括的な詳細を提供します。 COVIDx CXR-3 が、科学者が COVID-19 パンデミックと関連疾患の両方に対して機械学習研究を進めるのを支援できることを願っています。
After more than two years since the beginning of the COVID-19 pandemic, the pressure of this crisis continues to devastate globally. The use of chest X-ray (CXR) imaging as a complementary screening strategy to RT-PCR testing is not only prevailing but has greatly increased due to its routine clinical use for respiratory complaints. Thus far, many visual perception models have been proposed for COVID-19 screening based on CXR imaging. Nevertheless, the accuracy and the generalization capacity of these models are very much dependent on the diversity and the size of the dataset they were trained on. Motivated by this, we introduce COVIDx CXR-3, a large-scale benchmark dataset of CXR images for supporting COVID-19 computer vision research. COVIDx CXR-3 is composed of 30,386 CXR images from a multinational cohort of 17,026 patients from at least 51 countries, making it, to the best of our knowledge, the most extensive, most diverse COVID-19 CXR dataset in open access form. Here, we provide comprehensive details on the various aspects of the proposed dataset including patient demographics, imaging views, and infection types. The hope is that COVIDx CXR-3 can assist scientists in advancing machine learning research against both the COVID-19 pandemic and related diseases.