弱く監視されたオブジェクト検出(WSOD)は、高価なインスタンスレベルのオブジェクト注釈を回避するための刺激的な最近のトピックとして浮上しています。ただし、ほとんどの既存のWSODメソッドの境界ボックスは、主に事前に計算された提案によって決定されるため、正確なオブジェクトのローカリゼーションが制限されます。このホワイトペーパーでは、適切に注釈が付けられた補助データセットからのバウンディングボックス回帰の知識を活用することにより、ローカリゼーションのパフォーマンスを向上させるための問題設定を擁護します。まず、適切に注釈が付けられた補助データセットを使用して、クラスに依存しない多段階のトレーニング方法で一連の学習可能なバウンディングボックスアジャスター(LBBA)を探索します。次に、LBBAと、重複しないクラスを持つ弱く注釈が付けられたデータセットのみが、LBBAでブーストされたWSODのトレーニングに使用されます。そのため、当社のLBBAは、十分に注釈が付けられた補助データセットのリークを回避しながら、実装するのが実際的により便利で経済的です。特に、学習バウンディングボックスアジャスターを2レベルの最適化問題として定式化し、EMのような多段階トレーニングアルゴリズムを提案します。次に、LBBAでブーストされたWSODの多段階スキームをさらに示します。さらに、提案の分類を改善するためにマスキング戦略が採用されています。実験結果は、私たちの方法の有効性を検証します。私たちの方法は、同様の問題設定を持つ最先端のWSOD方法および知識伝達モデルに対して有利に機能します。コードはhttps://github.com/DongSky/lbba_boosted_wsodで公開されています。
Weakly-supervised object detection (WSOD) has emerged as an inspiring recent topic to avoid expensive instance-level object annotations. However, the bounding boxes of most existing WSOD methods are mainly determined by precomputed proposals, thereby being limited in precise object localization. In this paper, we defend the problem setting for improving localization performance by leveraging the bounding box regression knowledge from a well-annotated auxiliary dataset. First, we use the well-annotated auxiliary dataset to explore a series of learnable bounding box adjusters (LBBAs) in a multi-stage training manner, which is class-agnostic. Then, only LBBAs and a weakly-annotated dataset with non-overlapped classes are used for training LBBA-boosted WSOD. As such, our LBBAs are practically more convenient and economical to implement while avoiding the leakage of the auxiliary well-annotated dataset. In particular, we formulate learning bounding box adjusters as a bi-level optimization problem and suggest an EM-like multi-stage training algorithm. Then, a multi-stage scheme is further presented for LBBA-boosted WSOD. Additionally, a masking strategy is adopted to improve proposal classification. Experimental results verify the effectiveness of our method. Our method performs favorably against state-of-the-art WSOD methods and knowledge transfer model with similar problem setting. Code is publicly available at https://github.com/DongSky/lbba_boosted_wsod.