arXiv reaDer
ドメイン適応としての弱く監視されたオブジェクトのローカリゼーション
Weakly Supervised Object Localization as Domain Adaption
弱教師ありオブジェクトローカリゼーション(WSOL)は、画像レベルの分類マスクの監視のみでオブジェクトをローカライズすることに焦点を当てています。以前のほとんどのWSOLメソッドは、マルチインスタンス学習(MIL)メカニズムを使用した分類構造に基づいてオブジェクトをローカライズする分類アクティベーションマップ(CAM)に従います。ただし、MILメカニズムにより、CAMはオブジェクト全体ではなく、識別可能なオブジェクト部分のみをアクティブ化するため、オブジェクトをローカライズするためのパフォーマンスが低下します。この問題を回避するために、この作業は、WSOLをドメイン適応(DA)タスクとしてモデル化する新しい視点を提供します。この場合、ソース/イメージドメインでトレーニングされたスコア推定器がターゲット/ピクセルドメインでテストされ、オブジェクトが特定されます。この観点から、DA-WSOLパイプラインは、ローカリゼーションのパフォーマンスを向上させるために、DAアプローチをWSOLにうまく組み込むように設計されています。提案されたターゲットサンプリング戦略を利用して、さまざまなタイプのターゲットサンプルを選択します。これらのタイプのターゲットサンプルに基づいて、ドメイン適応ローカリゼーション(DAL)の損失が詳しく説明されています。これは、DAによって2つのドメイン間の特徴分布を調整し、推定器に大学の正則化によってターゲットドメインの手がかりを認識させます。実験によると、私たちのパイプラインは、マルチベンチマークでSOTAメソッドよりも優れています。コードはhttps://github.com/zh460045050/DA-WSOL_CVPR2022でリリースされています。
Weakly supervised object localization (WSOL) focuses on localizing objects only with the supervision of image-level classification masks. Most previous WSOL methods follow the classification activation map (CAM) that localizes objects based on the classification structure with the multi-instance learning (MIL) mechanism. However, the MIL mechanism makes CAM only activate discriminative object parts rather than the whole object, weakening its performance for localizing objects. To avoid this problem, this work provides a novel perspective that models WSOL as a domain adaption (DA) task, where the score estimator trained on the source/image domain is tested on the target/pixel domain to locate objects. Under this perspective, a DA-WSOL pipeline is designed to better engage DA approaches into WSOL to enhance localization performance. It utilizes a proposed target sampling strategy to select different types of target samples. Based on these types of target samples, domain adaption localization (DAL) loss is elaborated. It aligns the feature distribution between the two domains by DA and makes the estimator perceive target domain cues by Universum regularization. Experiments show that our pipeline outperforms SOTA methods on multi benchmarks. Code are released at https://github.com/zh460045050/DA-WSOL_CVPR2022.
updated: Thu Mar 03 2022 13:50:22 GMT+0000 (UTC)
published: Thu Mar 03 2022 13:50:22 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト