arXiv reaDer
CFA:一般化された少数ショットオブジェクト検出のための制約ベースの微調整アプローチ
CFA: Constraint-based Finetuning Approach for Generalized Few-Shot Object Detection
少数ショットオブジェクト検出(FSOD)は、豊富な基本データからの事前知識を活用することにより、限られたデータで新しいカテゴリを検出しようとします。一般化された数ショットオブジェクト検出(G-FSOD)は、以前に見た基本クラスを忘れることなくFSODに取り組むことを目的としているため、テスト時間中に両方のクラスに遭遇する、より現実的なシナリオを説明します。現在のFSODメソッドは壊滅的な忘却に悩まされていますが、G-FSODはこの制限に対処しますが、最先端のFSODと比較して新しいタスクのパフォーマンスが低下します。この作業では、モデルの容量を増やすことなく、新しいタスクで競争力のある結果を達成しながら、壊滅的な忘却を軽減するための制約ベースの微調整アプローチ(CFA)を提案します。 CFAは、継続的な学習方法、つまり平均勾配エピソード記憶(A-GEM)をG-FSODに適合させます。具体的には、新しい勾配更新ルールが導出される勾配検索戦略により多くの制約が課せられ、基本クラスと新規クラスの間のより良い知識交換が可能になります。私たちの方法を評価するために、MS-COCOおよびPASCAL-VOCデータセットで広範な実験を行います。私たちの方法は、基本タスクでのマイナーな退化を伴う新規タスクでの現在のFSODおよびG-FSODアプローチよりも優れています。さらに、CFAはFSODアプローチと直交しており、モデルの容量や推論時間を増やすことなく、プラグアンドプレイモジュールとして動作します。
Few-shot object detection (FSOD) seeks to detect novel categories with limited data by leveraging prior knowledge from abundant base data. Generalized few-shot object detection (G-FSOD) aims to tackle FSOD without forgetting previously seen base classes and, thus, accounts for a more realistic scenario, where both classes are encountered during test time. While current FSOD methods suffer from catastrophic forgetting, G-FSOD addresses this limitation yet exhibits a performance drop on novel tasks compared to the state-of-the-art FSOD. In this work, we propose a constraint-based finetuning approach (CFA) to alleviate catastrophic forgetting, while achieving competitive results on the novel task without increasing the model capacity. CFA adapts a continual learning method, namely Average Gradient Episodic Memory (A-GEM) to G-FSOD. Specifically, more constraints on the gradient search strategy are imposed from which a new gradient update rule is derived, allowing for better knowledge exchange between base and novel classes. To evaluate our method, we conduct extensive experiments on MS-COCO and PASCAL-VOC datasets. Our method outperforms current FSOD and G-FSOD approaches on the novel task with minor degeneration on the base task. Moreover, CFA is orthogonal to FSOD approaches and operates as a plug-and-play module without increasing the model capacity or inference time.
updated: Mon Apr 11 2022 16:04:54 GMT+0000 (UTC)
published: Mon Apr 11 2022 16:04:54 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト