arXiv reaDer
筋肉:相互情報量の最大化を使用した同時教師なし学習による半教師あり学習の強化
MUSCLE: Strengthening Semi-Supervised Learning Via Concurrent Unsupervised Learning Using Mutual Information Maximization
ディープニューラルネットワークは、教師あり学習タスクでうまく機能することが示されている、強力で大規模にパラメーター化された機械学習モデルです。ただし、通常、ディープニューラルネットワークをトレーニングするには、非常に大量のラベル付きデータが必要です。少量のラベル付きデータと大量のラベルなしデータを使用してニューラルネットワークをトレーニングするために、いくつかの半教師あり学習アプローチが提案されています。これらの半教師あり方法のパフォーマンスは、ラベル付けされたデータのサイズが小さくなるにつれて大幅に低下します。相互情報量ベースの教師なしおよび半教師あり同時学習(MUSCLE)を紹介します。これは、相互情報量を使用して教師なし学習と半教師あり学習の両方を組み合わせるハイブリッド学習アプローチです。 MUSCLEは、ニューラルネットワークのスタンドアロントレーニングスキームとして使用でき、他の学習アプローチに組み込むこともできます。提案されたハイブリッドモデルが、CIFAR-10、CIFAR-100、Mini-Imagenetなどのいくつかの標準ベンチマークで最先端のパフォーマンスを上回っていることを示します。さらに、パフォーマンスの向上は、ラベル付けされたデータの量が減少するとともに、バイアスが存在する場合でも一貫して向上します。また、MUSCLEは、ラベルのないデータのみで事前トレーニングされたモデルの微調整フェーズで使用すると、分類パフォーマンスを向上させる可能性があることも示しています。
Deep neural networks are powerful, massively parameterized machine learning models that have been shown to perform well in supervised learning tasks. However, very large amounts of labeled data are usually needed to train deep neural networks. Several semi-supervised learning approaches have been proposed to train neural networks using smaller amounts of labeled data with a large amount of unlabeled data. The performance of these semi-supervised methods significantly degrades as the size of labeled data decreases. We introduce Mutual-information-based Unsupervised & Semi-supervised Concurrent LEarning (MUSCLE), a hybrid learning approach that uses mutual information to combine both unsupervised and semi-supervised learning. MUSCLE can be used as a stand-alone training scheme for neural networks, and can also be incorporated into other learning approaches. We show that the proposed hybrid model outperforms state of the art on several standard benchmarks, including CIFAR-10, CIFAR-100, and Mini-Imagenet. Furthermore, the performance gain consistently increases with the reduction in the amount of labeled data, as well as in the presence of bias. We also show that MUSCLE has the potential to boost the classification performance when used in the fine-tuning phase for a model pre-trained only on unlabeled data.
updated: Mon Nov 30 2020 23:01:04 GMT+0000 (UTC)
published: Mon Nov 30 2020 23:01:04 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト