10個の前処理された医療用オープンデータセットのコレクションであるMedMNISTを紹介します。 MedMNISTは、背景知識を必要としない軽量の28x28画像で分類タスクを実行するように標準化されています。医療画像分析の主要なデータモダリティをカバーし、データスケール(100から100,000)とタスク(バイナリ/マルチクラス、順序回帰、マルチラベル)で多様です。 MedMNISTは、教育目的、ラピッドプロトタイピング、マルチモーダル機械学習、または医療画像分析のAutoMLに使用できます。さらに、MedMNIST分類十種競技は、10個のデータセットすべてでAutoMLアルゴリズムのベンチマークを行うように設計されています。オープンソースまたは商用のAutoMLツールを含むいくつかのベースライン手法を比較しました。 MedMNISTのデータセット、評価コード、ベースラインメソッドは、https://medmnist.github.io/で公開されています。
We present MedMNIST, a collection of 10 pre-processed medical open datasets. MedMNIST is standardized to perform classification tasks on lightweight 28x28 images, which requires no background knowledge. Covering the primary data modalities in medical image analysis, it is diverse on data scale (from 100 to 100,000) and tasks (binary/multi-class, ordinal regression and multi-label). MedMNIST could be used for educational purpose, rapid prototyping, multi-modal machine learning or AutoML in medical image analysis. Moreover, MedMNIST Classification Decathlon is designed to benchmark AutoML algorithms on all 10 datasets; We have compared several baseline methods, including open-source or commercial AutoML tools. The datasets, evaluation code and baseline methods for MedMNIST are publicly available at https://medmnist.github.io/.