このホワイトペーパーでは、既存の完全にラベル付けされたカテゴリを活用して、新しいオブジェクトカテゴリの弱教師あり検出(WSD)を改善する問題を検討します。これは、混合監視検出(MSD)と呼ばれます。事前トレーニング済みのオブジェクト検出器を既存のカテゴリから新しいカテゴリに直接転送する以前のMSDメソッドとは異なり、MSDのより合理的で堅牢なオブジェクト性転送アプローチを提案します。このフレームワークでは、まず、既存の完全にラベル付けされたカテゴリからドメイン不変のオブジェクト性の知識を学習します。知識は、既存のカテゴリと新しいカテゴリ間の分布の不一致に強い不変の特徴に基づいてモデル化されます。したがって、得られた知識は新しいカテゴリにうまく一般化され、検出モデルが新しいカテゴリの弱くラベル付けされた画像のディストラクタ(たとえば、オブジェクトパーツ)を拒否するのに役立ちます。学習したオブジェクト性知識の指導の下で、複数インスタンス学習(MIL)を利用して、オブジェクトとディストラクタの両方の概念をモデル化し、弱くラベル付けされた画像のディストラクタを拒否する能力をさらに向上させます。堅牢なオブジェクトネス転送アプローチは、既存のMSDメソッドよりも優れており、困難なILSVRC2013検出データセットとPASCAL VOCデータセットで最先端の結果を達成します。
In this paper, we consider the problem of leveraging existing fully labeled categories to improve the weakly supervised detection (WSD) of new object categories, which we refer to as mixed supervised detection (MSD). Different from previous MSD methods that directly transfer the pre-trained object detectors from existing categories to new categories, we propose a more reasonable and robust objectness transfer approach for MSD. In our framework, we first learn domain-invariant objectness knowledge from the existing fully labeled categories. The knowledge is modeled based on invariant features that are robust to the distribution discrepancy between the existing categories and new categories; therefore the resulting knowledge would generalize well to new categories and could assist detection models to reject distractors (e.g., object parts) in weakly labeled images of new categories. Under the guidance of learned objectness knowledge, we utilize multiple instance learning (MIL) to model the concepts of both objects and distractors and to further improve the ability of rejecting distractors in weakly labeled images. Our robust objectness transfer approach outperforms the existing MSD methods, and achieves state-of-the-art results on the challenging ILSVRC2013 detection dataset and the PASCAL VOC datasets.