arXiv reaDer
不均衡な半教師あり学習のための分布を意識した意味論指向の疑似ラベル
Distribution-Aware Semantics-Oriented Pseudo-label for Imbalanced Semi-Supervised Learning
従来の半教師あり学習(SSL)メソッドの機能は、(1)クラスの不均衡、および(2)ラベル付きデータとラベルなしデータ間のクラス分布の不一致を考慮していないため、実際のアプリケーションとはほど遠いものです。このホワイトペーパーでは、このような比較的十分に検討されていない問題、不均衡な半教師あり学習について説明します。この問題では、大きく偏った疑似ラベルがモデルのパフォーマンスに悪影響を与える可能性があります。興味深いことに、特徴空間の類似性ベースの分類器からのセマンティック疑似ラベルと線形分類器からの従来の疑似ラベルが補完的なプロパティを示していることがわかります。この目的のために、この観察によって動機付けられたバイアスに対処するための一般的な疑似ラベリングフレームワークを提案します。重要なアイデアは、現在の疑似ラベルの分布に応じて、セマンティック疑似ラベルを線形疑似ラベルにクラス適応的にブレンドすることです。これにより、セマンティック疑似ラベルコンポーネントの増加により、多数派クラスの誤検知が抑制され、その逆も同様です。不均衡なSSLの新しい疑似ラベリングフレームワークを、Distribution-Aware Semantics-Oriented(DASO)疑似ラベルと呼びます。 CIFAR10 / 100-LTとSTL10-LTの広範な評価は、DASOが最近提案されたラベルと疑似ラベルの両方のリバランス方法を一貫して上回っていることを示しています。さらに、特に(1)クラスの不均衡と(2)クラスの分布の不一致が存在する場合、および最近の実際のSemi-Avesベンチマークでも、一般的なSSLアルゴリズムがDASOを使用してラベルなしデータから効果的に恩恵を受けることができることを示します。
The capability of the traditional semi-supervised learning (SSL) methods is far from real-world application since they do not consider (1) class imbalance and (2) class distribution mismatch between labeled and unlabeled data. This paper addresses such a relatively under-explored problem, imbalanced semi-supervised learning, where heavily biased pseudo-labels can harm the model performance. Interestingly, we find that the semantic pseudo-labels from a similarity-based classifier in feature space and the traditional pseudo-labels from the linear classifier show the complementary property. To this end, we propose a general pseudo-labeling framework to address the bias motivated by this observation. The key idea is to class-adaptively blend the semantic pseudo-label to the linear one, depending on the current pseudo-label distribution. Thereby, the increased semantic pseudo-label component suppresses the false positives in the majority classes and vice versa. We term the novel pseudo-labeling framework for imbalanced SSL as Distribution-Aware Semantics-Oriented (DASO) Pseudo-label. Extensive evaluation on CIFAR10/100-LT and STL10-LT shows that DASO consistently outperforms both recently proposed re-balancing methods for label and pseudo-label. Moreover, we demonstrate that typical SSL algorithms can effectively benefit from unlabeled data with DASO, especially when (1) class imbalance and (2) class distribution mismatch exist and even on recent real-world Semi-Aves benchmark.
updated: Thu Jun 10 2021 11:58:25 GMT+0000 (UTC)
published: Thu Jun 10 2021 11:58:25 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト