arXiv reaDer
S4OD:単一ステージのオブジェクト検出のための半教師あり学習
S4OD: Semi-Supervised learning for Single-Stage Object Detection
一段式検出器は前景と背景のクラスの極端な不均衡に悩まされますが、二段式検出器はそうではありません。したがって、半教師あり物体検出では、分類スコアに基づいて高品質の疑似ラベルを選択するだけで、2段階の検出器が優れたパフォーマンスを発揮します。ただし、この戦略を単段検出器に直接適用すると、正のサンプルが少なくなり、クラスの不均衡が悪化します。したがって、単段検出器は、疑似ラベルの質と量の両方を同時に考慮する必要があります。この論文では、分類ブランチで動的自己適応しきい値(DSAT)戦略を設計します。これにより、疑似ラベルを自動的に選択して、品質と量の間の最適なトレードオフを実現できます。さらに、単段検出器の疑似ラベルの回帰品質を評価するために、非最大抑制に基づいてボックスの回帰不確実性を計算するモジュールを提案します。 COCOからの10%のラベル付きデータのみを活用することにより、この方法では、アンカーフリー検出器(FCOS)で35.0%、アンカーベースの検出器(RetinaNet)で32.9%のAPを達成します。
Single-stage detectors suffer from extreme foreground-background class imbalance, while two-stage detectors do not. Therefore, in semi-supervised object detection, two-stage detectors can deliver remarkable performance by only selecting high-quality pseudo labels based on classification scores. However, directly applying this strategy to single-stage detectors would aggravate the class imbalance with fewer positive samples. Thus, single-stage detectors have to consider both quality and quantity of pseudo labels simultaneously. In this paper, we design a dynamic self-adaptive threshold (DSAT) strategy in classification branch, which can automatically select pseudo labels to achieve an optimal trade-off between quality and quantity. Besides, to assess the regression quality of pseudo labels in single-stage detectors, we propose a module to compute the regression uncertainty of boxes based on Non-Maximum Suppression. By leveraging only 10% labeled data from COCO, our method achieves 35.0% AP on anchor-free detector (FCOS) and 32.9% on anchor-based detector (RetinaNet).
updated: Sat Apr 09 2022 15:19:37 GMT+0000 (UTC)
published: Sat Apr 09 2022 15:19:37 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト