弱く監視されたオブジェクト検出は、境界ボックスの必要性をなくすことによって監視の量を制限しようとしますが、トレーニングセット全体で画像レベルのラベルを想定しています。この作業では、画像レベルのラベルが付いた1つまたはいくつかの画像と、完全にラベル付けされていない画像のより大きなセットからオブジェクト検出器をトレーニングする問題を検討します。これは、ラベル付きデータが検出器の学習をブートストラップするのに十分ではない、半教師あり学習の極端なケースです。私たちのソリューションは、教師付き分類子モデルによってラベルなしのセットで生成された画像レベルの疑似ラベルから、教師付きの生徒検出器モデルをトレーニングし、ラベル付き画像との領域レベルの類似性によってブートストラップすることです。最近の代表的な弱監視パイプラインPCLに基づいて、私たちのメソッドは、より多くのラベルなし画像を使用して、多くの最近の弱監視検出ソリューションに匹敵する、または優れたパフォーマンスを実現できます。
Weakly-supervised object detection attempts to limit the amount of supervision by dispensing the need for bounding boxes, but still assumes image-level labels on the entire training set. In this work, we study the problem of training an object detector from one or few images with image-level labels and a larger set of completely unlabeled images. This is an extreme case of semi-supervised learning where the labeled data are not enough to bootstrap the learning of a detector. Our solution is to train a weakly-supervised student detector model from image-level pseudo-labels generated on the unlabeled set by a teacher classifier model, bootstrapped by region-level similarities to labeled images. Building upon the recent representative weakly-supervised pipeline PCL, our method can use more unlabeled images to achieve performance competitive or superior to many recent weakly-supervised detection solutions.