新しいクラスを効果的に処理するための注釈効率の高いトレーニング方法である、教師が弱いローショットインスタンスセグメンテーションに対処します。これは未調査の問題であるため、まず問題の難しさを調査し、単純なベースライン モデルを使用してモデル コンポーネントと個々のサブタスクを体系的に分析することにより、パフォーマンスのボトルネックを特定します。分析に基づいて、サブタスク拡張メソッドを使用して ENInst を提案します。ピクセル ローカリゼーションの品質を向上させるためのインスタンス単位のマスク リファインメントと、分類精度を向上させるための新しい分類器の構成です。提案手法は、各サブタスクのパフォーマンスを向上させることで全体のパフォーマンスを向上させます。当社の ENInst は、既存の完全に監視された少数ショット モデルに匹敵するパフォーマンスを達成する上で 7.5 倍効率的であり、時にはそれらを上回ることさえあります。
We address a weakly-supervised low-shot instance segmentation, an annotation-efficient training method to deal with novel classes effectively. Since it is an under-explored problem, we first investigate the difficulty of the problem and identify the performance bottleneck by conducting systematic analyses of model components and individual sub-tasks with a simple baseline model. Based on the analyses, we propose ENInst with sub-task enhancement methods: instance-wise mask refinement for enhancing pixel localization quality and novel classifier composition for improving classification accuracy. Our proposed method lifts the overall performance by enhancing the performance of each sub-task. We demonstrate that our ENInst is 7.5 times more efficient in achieving comparable performance to the existing fully-supervised few-shot models and even outperforms them at times.