arXiv reaDer
半教師あり物体検出のためのトレーニングベースのモデル改良と表現の不一致
Training-based Model Refinement and Representation Disagreement for Semi-Supervised Object Detection
半教師あり物体検出 (SSOD) は、限られたラベル付きデータと大量のラベルなしデータを利用することで、既存の物体検出器のパフォーマンスを向上させ、汎用化することを目的としています。多くの進歩にもかかわらず、最近の SSOD 手法は依然として、古典的な指数移動平均 (EMA) 戦略を使用したモデルの改良が不十分であること、トレーニングの後期段階での教師と生徒のモデルのコンセンサス (つまり、独自性が失われること)、ノイズが多い/誤解を招くという課題を抱えています。疑似ラベル。この論文では、古典的な EMA の限界とコンセンサス問題に対処するための、新しいトレーニングベースのモデル改良 (TMR) ステージと、シンプルだが効果的な表現不一致 (RD) 戦略を提案します。教師-生徒モデルの TMR ステージは、軽量のスケーリング操作を最適化してモデルの重みを調整し、ラベルのないデータから学習したパターンの過剰適合や忘れを防ぎます。一方、RD 戦略は、これらのモデルを分岐させて、学生モデルが相補的な表現を探索することを奨励するのに役立ちます。私たちのアプローチは確立された SSOD 手法に統合でき、カスケード回帰ありとなしの 2 つのベースライン手法を使用して経験的に検証され、より信頼性の高い疑似ラベルを生成します。広範な実験により、最先端の SSOD 手法よりも当社のアプローチの優れたパフォーマンスが実証されました。具体的には、提案されたアプローチは、COCO 標準、COCO- でベースラインの Unbiased-Teacher-v2 (および Unbiased-Teacher-v1) メソッドの平均 mAP マージン 2.23、2.1、および 3.36 (および 2.07、1.9、および 3.27) を上回っています。それぞれ追加の VOC データセットと Pascal VOC データセット。
Semi-supervised object detection (SSOD) aims to improve the performance and generalization of existing object detectors by utilizing limited labeled data and extensive unlabeled data. Despite many advances, recent SSOD methods are still challenged by inadequate model refinement using the classical exponential moving average (EMA) strategy, the consensus of Teacher-Student models in the latter stages of training (i.e., losing their distinctiveness), and noisy/misleading pseudo-labels. This paper proposes a novel training-based model refinement (TMR) stage and a simple yet effective representation disagreement (RD) strategy to address the limitations of classical EMA and the consensus problem. The TMR stage of Teacher-Student models optimizes the lightweight scaling operation to refine the model's weights and prevent overfitting or forgetting learned patterns from unlabeled data. Meanwhile, the RD strategy helps keep these models diverged to encourage the student model to explore complementary representations. Our approach can be integrated into established SSOD methods and is empirically validated using two baseline methods, with and without cascade regression, to generate more reliable pseudo-labels. Extensive experiments demonstrate the superior performance of our approach over state-of-the-art SSOD methods. Specifically, the proposed approach outperforms the baseline Unbiased-Teacher-v2 (& Unbiased-Teacher-v1) method by an average mAP margin of 2.23, 2.1, and 3.36 (& 2.07, 1.9, and 3.27) on COCO-standard, COCO-additional, and Pascal VOC datasets, respectively.
updated: Thu Aug 24 2023 19:57:07 GMT+0000 (UTC)
published: Tue Jul 25 2023 18:26:22 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト