arXiv reaDer
弱教師付きセマンティック セグメンテーションのローカリゼーションの拡大と縮小
Expansion and Shrinkage of Localization for Weakly-Supervised Semantic Segmentation
厳密なクラス認識疑似グラウンド トゥルース (別名、クラス アクティベーション マップ (CAM)) を生成することは、教師が弱いセマンティック セグメンテーションに不可欠です。元の CAM メソッドでは、通常、不完全で不正確なローカリゼーション マップが生成されます。この問題に取り組むために、この論文では、変形可能な畳み込みでのオフセット学習に基づく拡張と縮小のスキームを提案し、2 つのそれぞれの段階で、特定されたオブジェクトの再現率と精度を順次改善します。拡張段階では、「拡張サンプラー」と呼ばれる変形可能な畳み込みレイヤーのオフセット学習ブランチが、画像レベルの分類損失を最大化する逆監視信号によって駆動され、ますます識別性の低いオブジェクト領域をサンプリングしようとします。拡張ステージでより完全なオブジェクトが特定され、収縮ステージで最終的なオブジェクト領域に徐々に絞り込まれます。収縮ステージでは、「収縮サンプラー」と呼ばれる別の変形可能な畳み込みレイヤーのオフセット学習ブランチが導入され、拡張ステージで発生した偽陽性の背景領域を除外して、ローカリゼーション マップの精度を向上させます。 PASCAL VOC 2012 および MS COCO 2014 でさまざまな実験を行い、弱い教師ありセマンティック セグメンテーションの他の最先端の方法よりも優れていることを実証します。コードは https://github.com/TyroneLi/ESOL_WSSS で公開されます。
Generating precise class-aware pseudo ground-truths, a.k.a, class activation maps (CAMs), is essential for weakly-supervised semantic segmentation. The original CAM method usually produces incomplete and inaccurate localization maps. To tackle with this issue, this paper proposes an Expansion and Shrinkage scheme based on the offset learning in the deformable convolution, to sequentially improve the recall and precision of the located object in the two respective stages. In the Expansion stage, an offset learning branch in a deformable convolution layer, referred as "expansion sampler" seeks for sampling increasingly less discriminative object regions, driven by an inverse supervision signal that maximizes image-level classification loss. The located more complete object in the Expansion stage is then gradually narrowed down to the final object region during the Shrinkage stage. In the Shrinkage stage, the offset learning branch of another deformable convolution layer, referred as "shrinkage sampler", is introduced to exclude the false positive background regions attended in the Expansion stage to improve the precision of the localization maps. We conduct various experiments on PASCAL VOC 2012 and MS COCO 2014 to well demonstrate the superiority of our method over other state-of-the-art methods for weakly-supervised semantic segmentation. Code will be made publicly available here https://github.com/TyroneLi/ESOL_WSSS.
updated: Fri Sep 16 2022 07:39:02 GMT+0000 (UTC)
published: Fri Sep 16 2022 07:39:02 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト