Weakly Supervised Foreground Learning for Weakly Supervised Localization and Detection

Chen-Lin Zhang; Yin Li; Jianxin Wu

弱教師ありローカリゼーションと検出のための弱教師あり前景学習

最新の深層学習モデルでは、正確に注釈が付けられた大量のデータが必要ですが、これを満足させるのは難しい場合があります。したがって、弱教師ありオブジェクトのローカリゼーション〜（WSOL）や検出〜（WSOD）など、弱教師ありタスクが最近コンピュータビジョンコミュニティで注目されています。この論文では、グラウンドトゥルース前景マスクが利用可能であれば、WSOLとWSODの両方を大幅に改善できることを示すことにより、弱教師あり前景学習（WSFL）タスクの動機付けと提案を行います。さらに重要なことに、疑似ボックスを生成し、前景マスクを学習し、ローカリゼーションアノテーションを必要としない、計算コストの低い完全なWSFLパイプラインを提案します。 WSFLモデルによって予測された前景マスクの助けを借りて、WSOLのCUBで72.97％の正しいローカリゼーション精度を達成し、WSODのVOC07で55.7％の平均平均精度を達成し、それによって両方のタスクの新しい最先端を確立します。当社のWSFLモデルも優れた転送能力を示しています。

Modern deep learning models require large amounts of accurately annotated data, which is often difficult to satisfy. Hence, weakly supervised tasks, including weakly supervised object localization~(WSOL) and detection~(WSOD), have recently received attention in the computer vision community. In this paper, we motivate and propose the weakly supervised foreground learning (WSFL) task by showing that both WSOL and WSOD can be greatly improved if groundtruth foreground masks are available. More importantly, we propose a complete WSFL pipeline with low computational cost, which generates pseudo boxes, learns foreground masks, and does not need any localization annotations. With the help of foreground masks predicted by our WSFL model, we achieve 72.97% correct localization accuracy on CUB for WSOL, and 55.7% mean average precision on VOC07 for WSOD, thereby establish new state-of-the-art for both tasks. Our WSFL model also shows excellent transfer ability.

updated: Tue Aug 03 2021 23:33:51 GMT+0000 (UTC)

published: Tue Aug 03 2021 23:33:51 GMT+0000 (UTC)

arXiv

参考文献 (このサイトで利用可能なもの) / References (only if available on this site)

被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)

Amazon.co.jpアソシエイト