arXiv reaDer
開集合半教師あり学習に関する実証的研究と分析
An Empirical Study and Analysis on Open-Set Semi-Supervised Learning
疑似ラベリング(PL)とデータ拡張ベースの一貫性トレーニング(DACT)は、半教師あり学習(SSL)メソッドで広く使用されている2つのアプローチです。これらの方法は、効率的なトレーニングのためにラベルのないデータを利用することにより、多くの機械学習タスクで大きな力を発揮します。ただし、ラベルのないデータセットに配布外(OOD)サンプルが含まれている、より現実的な設定(オープンセットSSLと呼ばれる)では、従来のSSLメソッドはパフォーマンスが大幅に低下します。最近のアプローチでは、ラベルのないデータからOODサンプルを除外することで、OODサンプルの悪影響を軽減しています。ただし、OODサンプルを直接削除することが最善の選択であるかどうかは明らかではありません。さらに、PLとDACTがオープンセットSSLで異なるパフォーマンスを発揮する理由は謎のままです。このホワイトペーパーでは、オープンセットSSLでのさまざまなSSLメソッド(PLおよびDACT)を徹底的に分析し、これら2つのアプローチの長所と短所について個別に説明します。私たちの分析に基づいて、オープンセットSSLで従来のSSLメソッドを改善するためのスタイル妨害を提案し、OODサンプルを適切に利用することでさまざまなデータセットで最先端の結果を達成できることを実験的に示します。私たちの研究はSSL研究に新しい洞察をもたらすことができると信じています。
Pseudo-labeling (PL) and Data Augmentation-based Consistency Training (DACT) are two approaches widely used in Semi-Supervised Learning (SSL) methods. These methods exhibit great power in many machine learning tasks by utilizing unlabeled data for efficient training. But in a more realistic setting (termed as open-set SSL), where unlabeled dataset contains out-of-distribution (OOD) samples, the traditional SSL methods suffer severe performance degradation. Recent approaches mitigate the negative influence of OOD samples by filtering them out from the unlabeled data. However, it is not clear whether directly removing the OOD samples is the best choice. Furthermore, why PL and DACT could perform differently in open-set SSL remains a mystery. In this paper, we thoroughly analyze various SSL methods (PL and DACT) on open-set SSL and discuss pros and cons of these two approaches separately. Based on our analysis, we propose Style Disturbance to improve traditional SSL methods on open-set SSL and experimentally show our approach can achieve state-of-the-art results on various datasets by utilizing OOD samples properly. We believe our study can bring new insights for SSL research.
updated: Tue Sep 14 2021 06:14:51 GMT+0000 (UTC)
published: Tue Jan 19 2021 12:38:17 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト