Learning with Hierarchical Complement Objective
 ラベル階層は、画像分類に存在する明示的なラベル階層からセマンティックセグメンテーションに存在する潜在的なラベル階層に至るまで、多くの視覚関連の問題に広く存在します。それにもかかわらず、最先端のメソッドは、クラスラベルが排他的であり、したがって相互に独立していると暗黙的に想定するクロスエントロピー損失を展開することがよくあります。通常、同じ親カテゴリのクラスは特定の類似性を共有しているという事実に基づいて、ラベル階層からの情報を活用する、階層補完目標トレーニング(HCOT)と呼ばれる新しいトレーニング図を設計します。 HCOTは、グラウンドトゥルースクラスの確率を最大化すると同時に、クラスの残りの確率を階層的に中和し、モデルがラベル階層を明示的に利用できるようにします。提案されたHCOTは、画像分類タスクとセマンティックセグメンテーションタスクの両方で評価されます。実験結果は、HCOTがCIFAR-100、ImageNet-2012、およびPASCAL-Contextの最先端モデルよりも優れていることを確認しています。この研究は、潜在的なラベル階層を持つタスクにHCOTを適用できることをさらに示しています。これは、多くの機械学習タスクに共通する特性です。
Label hierarchies widely exist in many vision-related problems, ranging from explicit label hierarchies existed in image classification to latent label hierarchies existed in semantic segmentation. Nevertheless, state-of-the-art methods often deploy cross-entropy loss that implicitly assumes class labels to be exclusive and thus independence from each other. Motivated by the fact that classes from the same parental category usually share certain similarity, we design a new training diagram called Hierarchical Complement Objective Training (HCOT) that leverages the information from label hierarchy. HCOT maximizes the probability of the ground truth class, and at the same time, neutralizes the probabilities of rest of the classes in a hierarchical fashion, making the model take advantage of the label hierarchy explicitly. The proposed HCOT is evaluated on both image classification and semantic segmentation tasks. Experimental results confirm that HCOT outperforms state-of-the-art models in CIFAR-100, ImageNet-2012, and PASCAL-Context. The study further demonstrates that HCOT can be applied on tasks with latent label hierarchies, which is a common characteristic in many machine learning tasks.
updated: Sun Nov 17 2019 15:46:38 GMT+0000 (UTC)
published: Sun Nov 17 2019 15:46:38 GMT+0000 (UTC)
