クラスの不均衡は、多くの機械学習分類タスクに固有の問題です。これにより、実際の目的には使用できないトレーニング済みモデルが作成されることがよくあります。この研究では、事前にトレーニングされた画像分類モデルからエンコーダベースの生成的敵対的ネットワーク(eGAN)への転送学習を活用することにより、これらの不均衡に対処するための教師なしアプローチを検討します。私たちの知る限り、これは、合成された偽の画像で補強する必要なしに、GANを使用してこの問題に取り組む最初の作業です。提案されたアプローチでは、弁別器ネットワークを使用して、負または正のスコアを出力します。少数派、テストサンプルが負のスコア、多数派が正のスコアに分類されます。 P(マイノリティ)+ P(マジョリティ)の合計が1になる必要がないため、私たちのアプローチはモデル予測における認識論的不確実性を排除します。ジェネレーターとディスクリミネーターでの転送学習とさまざまな事前トレーニング済み画像分類モデルの組み合わせの影響も調査されます。 。 0.69 F1スコアの最良の結果は、1:2500の不均衡比のCIFAR-10分類タスクで得られました。私たちのアプローチは、機械学習システムの特異性または感度をしきい値処理するメカニズムも提供します。キーワード:クラスの不均衡、転移学習、GAN、ナッシュ均衡
Class imbalance is an inherent problem in many machine learning classification tasks. This often leads to trained models that are unusable for any practical purpose. In this study we explore an unsupervised approach to address these imbalances by leveraging transfer learning from pre-trained image classification models to encoder-based Generative Adversarial Network (eGAN). To the best of our knowledge, this is the first work to tackle this problem using GAN without needing to augment with synthesized fake images. In the proposed approach we use the discriminator network to output a negative or positive score. We classify as minority, test samples with negative scores and as majority those with positive scores. Our approach eliminates epistemic uncertainty in model predictions, as the P(minority) + P(majority) need not sum up to 1. The impact of transfer learning and combinations of different pre-trained image classification models at the generator and discriminator is also explored. Best result of 0.69 F1-score was obtained on CIFAR-10 classification task with imbalance ratio of 1:2500. Our approach also provides a mechanism of thresholding the specificity or sensitivity of our machine learning system. Keywords: Class imbalance, Transfer Learning, GAN, nash equilibrium