arXiv reaDer
高度に不均衡な医用画像分類のためのBalanced-MixUp
Balanced-MixUp for Highly Imbalanced Medical Image Classification
高度に不均衡なデータセットは、医用画像分類の問題に遍在しています。このような問題では、あまり一般的ではない病気に関連するまれなクラスがラベル付きデータベースで大幅に過小評価されることがよくあり、通常、学習プロセスの過剰適合のために機械学習アルゴリズムのパフォーマンスが低下します。この論文では、Balanced-MixUpと呼ばれる一般的なMixUp正則化手法に基づいてトレーニングデータをサンプリングするための新しいメカニズムを提案します。つまり、Balanced-MixUpは、トレーニングデータの定期的な(つまり、インスタンスベースの)サンプリングとバランスの取れた(つまり、クラスベースの)サンプリングを同時に実行します。次に、結果の2セットのサンプルを混合して、よりバランスの取れたトレーニング分布を作成します。この分布から、ニューラルネットワークは、マイノリティクラスの適合度を大幅に下げることなく効果的に学習できます。さまざまな表現機能の2つのCNNを使用して、網膜画像の非常に不均衡なデータセット(55Kサンプル、5クラス)と胃腸ビデオフレームのロングテールデータセット(10K画像、23クラス)を実験します。実験結果は、Balanced-MixUpの適用が、不均衡なデータを処理するために特別に設計された他の従来のサンプリングスキームおよび損失関数よりも優れていることを示しています。コードはhttps://github.com/agaldran/balanced_mixupでリリースされています。
Highly imbalanced datasets are ubiquitous in medical image classification problems. In such problems, it is often the case that rare classes associated to less prevalent diseases are severely under-represented in labeled databases, typically resulting in poor performance of machine learning algorithms due to overfitting in the learning process. In this paper, we propose a novel mechanism for sampling training data based on the popular MixUp regularization technique, which we refer to as Balanced-MixUp. In short, Balanced-MixUp simultaneously performs regular (i.e., instance-based) and balanced (i.e., class-based) sampling of the training data. The resulting two sets of samples are then mixed-up to create a more balanced training distribution from which a neural network can effectively learn without incurring in heavily under-fitting the minority classes. We experiment with a highly imbalanced dataset of retinal images (55K samples, 5 classes) and a long-tail dataset of gastro-intestinal video frames (10K images, 23 classes), using two CNNs of varying representation capabilities. Experimental results demonstrate that applying Balanced-MixUp outperforms other conventional sampling schemes and loss functions specifically designed to deal with imbalanced data. Code is released at https://github.com/agaldran/balanced_mixup .
updated: Mon Sep 20 2021 21:31:31 GMT+0000 (UTC)
published: Mon Sep 20 2021 21:31:31 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト