クラスアクティベーションマップ(CAM)は、分類ネットワークに基づいてクラスの領域を強調表示します。分類ネットワークは、弱く監督されたタスクで広く使用されています。ただし、クラスアクティベーション領域は通常小さくローカルであるという問題に直面しています。 2番目のステップ(CAM生成ステップ)に費やされたいくつかの努力により、部分的に生成が強化されましたが、クラス全体でトレーニングされた単一の分類モデルには有限識別情報が含まれているため、このような問題は最初のステップ(トレーニングステップ)によっても発生すると考えられますオブジェクト領域の抽出を制限します。このため、このペーパーでは、複数の分類モデルを使用してCAM生成を解決します。異なる識別情報を運ぶ複数の分類ネットワークを形成するために、クラス間の意味関係をキャプチャして、分類モデルの異なる意味レベルを形成しようとします。具体的には、クラスリレーションシップに基づく階層型クラスタリングを使用して階層型クラスタリング結果を形成します。この場合、クラスタリングレベルは分類モデルを形成する意味レベルとして扱われます。さらに、新しい直交モジュールと2分岐ベースのCAM生成方法を提案して、直交および相補的なクラス領域を生成します。 PASCAL VOC 2012データセットを使用して、提案された方法を検証します。実験結果は、我々のアプローチがCAM生成を改善することを示しています。
Class activation map (CAM) highlights regions of classes based on classification network, which is widely used in weakly supervised tasks. However, it faces the problem that the class activation regions are usually small and local. Although several efforts paid to the second step (the CAM generation step) have partially enhanced the generation, we believe such problem is also caused by the first step (training step), because single classification model trained on the entire classes contains finite discriminate information that limits the object region extraction. To this end, this paper solves CAM generation by using multiple classification models. To form multiple classification networks that carry different discriminative information, we try to capture the semantic relationships between classes to form different semantic levels of classification models. Specifically, hierarchical clustering based on class relationships is used to form hierarchical clustering results, where the clustering levels are treated as semantic levels to form the classification models. Moreover, a new orthogonal module and a two-branch based CAM generation method are proposed to generate class regions that are orthogonal and complementary. We use the PASCAL VOC 2012 dataset to verify the proposed method. Experimental results show that our approach improves the CAM generation.