arXiv reaDer
弱教師オブジェクト検出のためのサイクリックブートストラップラベリング
Cyclic-Bootstrap Labeling for Weakly Supervised Object Detection
弱監視オブジェクト検出における最近の進歩は、複数インスタンス検出ネットワーク (MIDN) と通常のオンライン改良の組み合わせによって特徴づけられています。ただし、画像レベルのアノテーションのみを使用すると、MIDN は疑似ラベルを生成するときに、必然的にいくつかの予期しない領域提案に高いスコアを割り当てます。これらの不正確な高スコア領域の提案は、後続のリファインメント モジュールのトレーニングに誤解を与え、検出パフォーマンスを妨げます。この研究では、MIDN の擬似ラベリングの品質を改善する方法を検討します。正式には、信頼できる教師ネットワークからのランク情報を使用して MIDN を最適化する、新しい弱監視オブジェクト検出パイプラインである巡回ブートストラップ ラベリング (CBL) を考案します。具体的には、さまざまな改良モジュールを利用する加重指数移動平均戦略を導入することで、この教師ネットワークを取得します。新しいクラス固有のランキング蒸留アルゴリズムは、ランク情報を含む MIDN を蒸留するために重み付きアンサンブル教師ネットワークの出力を活用するために提案されています。その結果、MIDN は、隣接する提案の中で正確な提案に高いスコアを割り当てるように誘導され、その後の疑似ラベル付けに利益をもたらします。一般的な PASCAL VOC 2007 および 2012 および COCO データセットに対する広範な実験により、CBL フレームワークの優れたパフォーマンスが実証されました。コードは https://github.com/Yeahyf0804/WSOD-CBL/ で入手できます。
Recent progress in weakly supervised object detection is featured by a combination of multiple instance detection networks (MIDN) and ordinal online refinement. However, with only image-level annotation, MIDN inevitably assigns high scores to some unexpected region proposals when generating pseudo labels. These inaccurate high-scoring region proposals will mislead the training of subsequent refinement modules and thus hamper the detection performance. In this work, we explore how to ameliorate the quality of pseudo-labeling in MIDN. Formally, we devise Cyclic-Bootstrap Labeling (CBL), a novel weakly supervised object detection pipeline, which optimizes MIDN with rank information from a reliable teacher network. Specifically, we obtain this teacher network by introducing a weighted exponential moving average strategy to take advantage of various refinement modules. A novel class-specific ranking distillation algorithm is proposed to leverage the output of weighted ensembled teacher network for distilling MIDN with rank information. As a result, MIDN is guided to assign higher scores to accurate proposals among their neighboring ones, thus benefiting the subsequent pseudo labeling. Extensive experiments on the prevalent PASCAL VOC 2007 \& 2012 and COCO datasets demonstrate the superior performance of our CBL framework. Code will be available at https://github.com/Yinyf0804/WSOD-CBL/.
updated: Fri Aug 11 2023 07:57:17 GMT+0000 (UTC)
published: Fri Aug 11 2023 07:57:17 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト