arXiv reaDer
CAM を単独で活用する: 弱い教師ありセマンティック セグメンテーションのための補完的な学習システム
Exploit CAM by itself: Complementary Learning System for Weakly Supervised Semantic Segmentation
画像レベルのラベルを使用した弱い教師ありセマンティック セグメンテーション (WSSS) は、セマンティック セグメンテーション用のきめの細かいマスクを生成できないクラス アクティベーション マップ (CAM) によって導かれるフラグメント オブジェクト領域に長い間悩まされてきました。より非識別的なオブジェクト パターンを見つけるように CAM を導くために、このペーパーでは、補完学習システム (CLS) という名前のエージェント学習における興味深い動作メカニズムに目を向けます。 CLS は、新皮質が一般的な知識の感覚を構築する一方で、海馬が特定の詳細を特別に学習し、学習したパターンを完成させると考えています。このシンプルだが効果的な学習パターンに動機付けられて、粗粒度の CAM を細粒度の疑似マスクに明示的に駆動するための汎用固有学習メカニズム (GSLM) を提案します。具体的には、GSLM は一般学習モジュール (GLM) と特定学習モジュール (SLM) を開発します。 GLM は、CAM から粗い一般的なローカリゼーション表現を抽出するために、画像レベルの監視でトレーニングされます。 GLM の一般的な知識に基づいて、SLM はローカリゼーション表現から特定の空間知識を徐々に活用し、明示的な方法で CAM を拡張します。この目的のために、アクティブ化値の境界を設定することにより、SLM が非識別領域を再アクティブ化するのを支援するシード再アクティブ化を提案します。これにより、CAM のより多くの領域が連続的に識別されます。追加の改良プロセスなしで、私たちの方法は、PASCAL VOC 2012 で 20.0% mIoU 以上、MS COCO 2014 データセットで 10.0% mIoU の CAM の画期的な改善を達成することができ、既存の WSSS メソッドの中で新しい最先端を表しています。
Weakly Supervised Semantic Segmentation (WSSS) with image-level labels has long been suffering from fragmentary object regions led by Class Activation Map (CAM), which is incapable of generating fine-grained masks for semantic segmentation. To guide CAM to find more non-discriminating object patterns, this paper turns to an interesting working mechanism in agent learning named Complementary Learning System (CLS). CLS holds that the neocortex builds a sensation of general knowledge, while the hippocampus specially learns specific details, completing the learned patterns. Motivated by this simple but effective learning pattern, we propose a General-Specific Learning Mechanism (GSLM) to explicitly drive a coarse-grained CAM to a fine-grained pseudo mask. Specifically, GSLM develops a General Learning Module (GLM) and a Specific Learning Module (SLM). The GLM is trained with image-level supervision to extract coarse and general localization representations from CAM. Based on the general knowledge in the GLM, the SLM progressively exploits the specific spatial knowledge from the localization representations, expanding the CAM in an explicit way. To this end, we propose the Seed Reactivation to help SLM reactivate non-discriminating regions by setting a boundary for activation values, which successively identifies more regions of CAM. Without extra refinement processes, our method is able to achieve breakthrough improvements for CAM of over 20.0% mIoU on PASCAL VOC 2012 and 10.0% mIoU on MS COCO 2014 datasets, representing a new state-of-the-art among existing WSSS methods.
updated: Sat Mar 04 2023 16:16:47 GMT+0000 (UTC)
published: Sat Mar 04 2023 16:16:47 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト