一般化された数ショットのセマンティックセグメンテーションは、新しいクラスでの数ショットのセグメンテーションモデルの評価だけでなく、基本クラスを記憶する能力のテストを含むように導入されました。現在の最先端のアプローチはメタ学習に基づいていますが、数ショットしか観察しないと、パフォーマンスが低下し、学習が飽和状態になります。最初の微調整ソリューションを提案し、PASCAL-5iとCOCO-20iの2つのデータセットで最先端の結果を達成しながら、飽和問題に対処することを示します。また、複数の最終レイヤーを微調整する場合でも、最終レイヤーのみを微調整する場合でも、既存の方法よりも優れていることも示しています。最後に、新規カテゴリと基本カテゴリの間のパフォーマンスのバランスを再配分して、それらの間のギャップを小さくする方法を示す、三重項損失の正則化を示します。
Generalized few-shot semantic segmentation was introduced to move beyond only evaluating few-shot segmentation models on novel classes to include testing their ability to remember base classes. While the current state-of-the-art approach is based on meta-learning, it performs poorly and saturates in learning after observing only a few shots. We propose the first fine-tuning solution, and demonstrate that it addresses the saturation problem while achieving state-of-the-art results on two datasets, PASCAL-5i and COCO-20i. We also show that it outperforms existing methods, whether fine-tuning multiple final layers or only the final layer. Finally, we present a triplet loss regularization that shows how to redistribute the balance of performance between novel and base categories so that there is a smaller gap between them.