半教師ありオブジェクト検出 (SSOD) は、R-CNN シリーズとアンカーフリー検出器の両方のパフォーマンスを向上させることに成功しています。ただし、1 段階のアンカーベースの検出器には、高品質または柔軟な疑似ラベルを生成する構造がないため、YOLOv5 などの SSOD で深刻な不一致の問題が発生します。このホワイト ペーパーでは、Dense Detector、Pseudo Label Assigner、および Epoch Adapter で構成される、スケーラブルで効果的な 1 段階のアンカー ベースの SSOD トレーニングのための効率的な教師フレームワークを提案します。 Dense Detector は、YOLOv5 に触発された高密度サンプリング技術で RetinaNet を拡張するベースライン モデルです。 Efficient Teacher フレームワークは、Pseudo Label Assigner という名前の新しい疑似ラベル割り当てメカニズムを導入します。これは、Dense Detector からの疑似ラベルをより洗練された方法で使用します。 Epoch Adapter は、Dense Detector の安定した効率的なエンドツーエンドの半教師付きトレーニング スケジュールを可能にする方法です。 Pseudo Label Assigner は、学生と教師の相互学習メカニズム中に Dense Detector に干渉する可能性のある多数の低品質の疑似ラベルによって引き起こされるバイアスの発生を防ぎます。また、Epoch Adapter はドメインと分布の適応を利用して、Dense Detector がグローバルに分散された一貫した機能を学習し、ラベル付けされたデータの割合からトレーニングを独立させます。私たちの実験では、Efficient Teacher フレームワークが、以前の方法よりも少ない FLOP を使用して、VOC、COCO-standard、および COCO-additional で最先端の結果を達成することが示されています。私たちの知る限りでは、これは半教師ありオブジェクト検出を YOLOv5 に適用する最初の試みです。
Semi-Supervised Object Detection (SSOD) has been successful in improving the performance of both R-CNN series and anchor-free detectors. However, one-stage anchor-based detectors lack the structure to generate high-quality or flexible pseudo labels, leading to serious inconsistency problems in SSOD, such as YOLOv5. In this paper, we propose the Efficient Teacher framework for scalable and effective one-stage anchor-based SSOD training, consisting of Dense Detector, Pseudo Label Assigner, and Epoch Adaptor. Dense Detector is a baseline model that extends RetinaNet with dense sampling techniques inspired by YOLOv5. The Efficient Teacher framework introduces a novel pseudo label assignment mechanism, named Pseudo Label Assigner, which makes more refined use of pseudo labels from Dense Detector. Epoch Adaptor is a method that enables a stable and efficient end-to-end semi-supervised training schedule for Dense Detector. The Pseudo Label Assigner prevents the occurrence of bias caused by a large number of low-quality pseudo labels that may interfere with the Dense Detector during the student-teacher mutual learning mechanism, and the Epoch Adaptor utilizes domain and distribution adaptation to allow Dense Detector to learn globally distributed consistent features, making the training independent of the proportion of labeled data. Our experiments show that the Efficient Teacher framework achieves state-of-the-art results on VOC, COCO-standard, and COCO-additional using fewer FLOPs than previous methods. To the best of our knowledge, this is the first attempt to apply Semi-Supervised Object Detection to YOLOv5.