現在の弱教師ありセマンティックセグメンテーション(WSSS)フレームワークには、通常、分離されたマスクリファインメントモデルとメインのセマンティック領域マイニングモデルが含まれています。これらのアプローチには、冗長な特徴抽出バックボーンと偏った学習目標が含まれているため、計算が複雑になりますが、WSSSタスクに対処するには最適ではありません。この問題を解決するために、この論文では、分類とマスクの改良のコンポーネントを統合されたディープモデルに組み込むコンパクトな学習フレームワークを確立します。共有特徴抽出バックボーンを使用すると、このモデルは、計算の複雑さを低く抑えながら、2つのコンポーネント間の知識共有を容易にすることができます。質の高い知識の相互作用を促進するために、新しい代替のセルフデュアルティーチング(ASDT)メカニズムを提案します。従来の蒸留戦略とは異なり、モデル内の2つの教師ブランチの知識は、パルス幅変調(PWM)によって代わりに学生ブランチに蒸留されます。これは、知識蒸留プロセスをガイドするPW波のような選択信号を生成します。このようにして、学生ブランチは、いずれかの教師ブランチから提供された不完全な知識によってモデルが極小解に陥るのを防ぐのに役立ちます。 PASCAL VOC2012とCOCO-Stuff10Kに関する包括的な実験は、提案された代替のセルフデュアルティーチングメカニズムの有効性と、私たちのアプローチの新しい最先端のパフォーマンスを示しています。
Current weakly supervised semantic segmentation (WSSS) frameworks usually contain the separated mask-refinement model and the main semantic region mining model. These approaches would contain redundant feature extraction backbones and biased learning objectives, making them computational complex yet sub-optimal to addressing the WSSS task. To solve this problem, this paper establishes a compact learning framework that embeds the classification and mask-refinement components into a unified deep model. With the shared feature extraction backbone, our model is able to facilitate knowledge sharing between the two components while preserving a low computational complexity. To encourage high-quality knowledge interaction, we propose a novel alternative self-dual teaching (ASDT) mechanism. Unlike the conventional distillation strategy, the knowledge of the two teacher branches in our model is alternatively distilled to the student branch by a Pulse Width Modulation (PWM), which generates PW wave-like selection signal to guide the knowledge distillation process. In this way, the student branch can help prevent the model from falling into local minimum solutions caused by the imperfect knowledge provided of either teacher branch. Comprehensive experiments on the PASCAL VOC 2012 and COCO-Stuff 10K demonstrate the effectiveness of the proposed alternative self-dual teaching mechanism as well as the new state-of-the-art performance of our approach.