arXiv reaDer
USB: 分類のための統合半教師あり学習ベンチマーク
USB: A Unified Semi-supervised Learning Benchmark for Classification
半教師あり学習 (SSL) は、大量のラベルなしデータを活用して限られたラベル付きサンプルを増強することにより、モデルの一般化を改善します。ただし、現在、一般的な SSL 評価プロトコルは、多くの場合、コンピューター ビジョン (CV) タスクに制約されています。さらに、以前の研究では通常、深層ニューラル ネットワークをゼロからトレーニングしますが、これは時間がかかり、環境に優しくありません。上記の問題に対処するために、CV、自然言語処理 (NLP)、および音声処理 (Audio) から 15 の多様で挑戦的で包括的なタスクを選択することにより、分類用の Unified SSL Benchmark (USB) を構築し、体系的に評価します。また、これらの SSL メソッドを公正に評価するために、モジュラーで拡張可能なコードベースをオープンソース化します。さらに、CV タスク用の最先端のニューラル モデルの事前トレーニング済みバージョンを提供して、さらなるチューニングのコストを手頃な価格にします。 USB を使用すると、複数のドメインからのより多くのタスクで単一の SSL アルゴリズムを評価できますが、コストは低くなります。具体的には、単一の NVIDIA V100 では、USB の 15 タスクで FixMatch を評価するのに 39 GPU 日しか必要とされませんが、TorchSSL を使用した 5 CV タスクでは 335 GPU 日 (ImageNet を除く 4 CV データセットで 279 GPU 日) が必要です。
Semi-supervised learning (SSL) improves model generalization by leveraging massive unlabeled data to augment limited labeled samples. However, currently, popular SSL evaluation protocols are often constrained to computer vision (CV) tasks. In addition, previous work typically trains deep neural networks from scratch, which is time-consuming and environmentally unfriendly. To address the above issues, we construct a Unified SSL Benchmark (USB) for classification by selecting 15 diverse, challenging, and comprehensive tasks from CV, natural language processing (NLP), and audio processing (Audio), on which we systematically evaluate the dominant SSL methods, and also open-source a modular and extensible codebase for fair evaluation of these SSL methods. We further provide the pre-trained versions of the state-of-the-art neural models for CV tasks to make the cost affordable for further tuning. USB enables the evaluation of a single SSL algorithm on more tasks from multiple domains but with less cost. Specifically, on a single NVIDIA V100, only 39 GPU days are required to evaluate FixMatch on 15 tasks in USB while 335 GPU days (279 GPU days on 4 CV datasets except for ImageNet) are needed on 5 CV tasks with TorchSSL.
updated: Fri Oct 14 2022 01:49:43 GMT+0000 (UTC)
published: Fri Aug 12 2022 15:45:48 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト