arXiv reaDer
ALIFE: インクリメンタル セマンティック セグメンテーションのための適応ロジット正則化と特徴リプレイ
ALIFE: Adaptive Logit Regularizer and Feature Replay for Incremental Semantic Segmentation
学習した以前のものを忘れることなく、新しいオブジェクト/もののカテゴリを継続的に認識するインクリメンタル セマンティック セグメンテーション (ISS) の問題に対処します。破滅的な忘却の問題は、ISS では特に深刻です。ピクセル レベルのグラウンド トゥルース ラベルは、トレーニング時に新しいカテゴリに対してのみ使用できるためです。この問題に対処するために、正則化ベースの方法では、確率キャリブレーション手法を利用して、ラベルのないピクセルからセマンティック情報を学習します。このような手法は効果的ですが、理論的な理解はまだ不足しています。リプレイベースの方法は、以前のカテゴリの画像の小さなセットを記憶することを提案しています。それらは、大規模なメモリ フットプリントを犠牲にして、最先端のパフォーマンスを実現します。この論文では、精度と効率の間のより良い妥協点を提供する、ALIFE と呼ばれる新しい ISS 方法を提案します。この目的のために、ISS への影響をよりよく理解するために、まずキャリブレーション手法に関する詳細な分析を示します。これに基づいて、モデルが以前のカテゴリの知識を保持しながら、新しいカテゴリをより適切に学習できるようにする適応ロジット正則化 (ALI) を導入します。また、メモリ要件を大幅に削減するために、画像を直接記憶する代わりに、特徴を記憶する特徴リプレイ スキームも提示します。特徴抽出器は継続的に変更されるため、記憶された特徴も増分段階ごとに更新する必要があります。これを処理するために、各カテゴリの機能を個別に更新するカテゴリ固有の回転行列を導入します。標準的な ISS ベンチマークでの広範な実験により、このアプローチの有効性を実証し、精度と効率の点でより優れたトレードオフを達成することを示します。
We address the problem of incremental semantic segmentation (ISS) recognizing novel object/stuff categories continually without forgetting previous ones that have been learned. The catastrophic forgetting problem is particularly severe in ISS, since pixel-level ground-truth labels are available only for the novel categories at training time. To address the problem, regularization-based methods exploit probability calibration techniques to learn semantic information from unlabeled pixels. While such techniques are effective, there is still a lack of theoretical understanding of them. Replay-based methods propose to memorize a small set of images for previous categories. They achieve state-of-the-art performance at the cost of large memory footprint. We propose in this paper a novel ISS method, dubbed ALIFE, that provides a better compromise between accuracy and efficiency. To this end, we first show an in-depth analysis on the calibration techniques to better understand the effects on ISS. Based on this, we then introduce an adaptive logit regularizer (ALI) that enables our model to better learn new categories, while retaining knowledge for previous ones. We also present a feature replay scheme that memorizes features, instead of images directly, in order to reduce memory requirements significantly. Since a feature extractor is changed continually, memorized features should also be updated at every incremental stage. To handle this, we introduce category-specific rotation matrices updating the features for each category separately. We demonstrate the effectiveness of our approach with extensive experiments on standard ISS benchmarks, and show that our method achieves a better trade-off in terms of accuracy and efficiency.
updated: Thu Oct 13 2022 07:58:00 GMT+0000 (UTC)
published: Thu Oct 13 2022 07:58:00 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト