arXiv reaDer
複数のデータセットからオブジェクト検出モデルをトレーニングするための擬似ラベリングしきい値の非反復最適化
Non-iterative optimization of pseudo-labeling thresholds for training object detection models from multiple datasets
低コストのデータセットのコレクションからオブジェクト検出を学習するための疑似ラベリングしきい値を最適化するための非反復的な方法を提案します。各データセットには、すべてのオブジェクト クラスのサブセットのみに対して注釈が付けられています。この問題に対する一般的なアプローチは、最初に教師モデルをトレーニングし、次に生徒モデルをトレーニングするときに、その信頼できる予測を疑似グラウンド トゥルース ラベルとして使用することです。ただし、最良の結果を得るには、予測信頼度のしきい値を調整する必要があります。このプロセスには通常、反復的な検索と学生モデルの繰り返しのトレーニングが含まれ、時間がかかります。したがって、検証データセットでF_βスコアを最大化することにより、反復最適化なしでしきい値を最適化する方法を開発します。これは、疑似ラベルの品質を測定し、学生モデルをトレーニングせずに測定できます。提案した方法が、COCO および VOC データセットのグリッド検索に匹敵する mAP を達成することを実験的に示します。
We propose a non-iterative method to optimize pseudo-labeling thresholds for learning object detection from a collection of low-cost datasets, each of which is annotated for only a subset of all the object classes. A popular approach to this problem is first to train teacher models and then to use their confident predictions as pseudo ground-truth labels when training a student model. To obtain the best result, however, thresholds for prediction confidence must be adjusted. This process typically involves iterative search and repeated training of student models and is time-consuming. Therefore, we develop a method to optimize the thresholds without iterative optimization by maximizing the F_β-score on a validation dataset, which measures the quality of pseudo labels and can be measured without training a student model. We experimentally demonstrate that our proposed method achieves an mAP comparable to that of grid search on the COCO and VOC datasets.
updated: Wed Oct 19 2022 00:31:34 GMT+0000 (UTC)
published: Wed Oct 19 2022 00:31:34 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト