arXiv reaDer
物体検出のためのローカリゼーション蒸留
Localization Distillation for Object Detection
オブジェクト検出のための以前の知識の蒸留 (KD) メソッドは、ローカリゼーション情報の抽出が非効率であるため、予測ロジットを模倣するのではなく、特徴の模倣に主に焦点を当てています。この論文では、ロジットの模倣が常に機能の模倣よりも遅れているかどうかを調査します。この目標に向けて、最初にローカリゼーションの知識を教師から生徒に効率的に伝達できる新しいローカリゼーション蒸留 (LD) メソッドを提示します。次に、特定の地域の分類とローカリゼーションの知識を選択的に抽出するのに役立つ貴重なローカリゼーション リージョンの概念を紹介します。これら 2 つの新しいコンポーネントを組み合わせることで、ロジットの模倣が機能の模倣よりも優れたパフォーマンスを発揮する可能性があり、ローカリゼーションの蒸留の欠如が、ロジットの模倣が何年にもわたってパフォーマンスが低下する重要な理由であることを初めて示しました。徹底的な研究により、ローカリゼーションのあいまいさを大幅に軽減し、堅牢な特徴表現を学習し、初期段階でのトレーニングの難しさを緩和できるロジット模倣の大きな可能性が示されています。また、提案された LD と分類 KD の間の理論的な接続を提供し、それらが同等の最適化効果を共有することを示します。私たちの蒸留スキームはシンプルで効果的であり、高密度の水平物体検出器と回転物体検出器の両方に簡単に適用できます。 MS COCO、PASCAL VOC、および DOTA ベンチマークでの広範な実験により、推論速度を犠牲にすることなく、この方法で AP を大幅に改善できることが実証されました。ソース コードと事前トレーニング済みのモデルは、https://github.com/HikariTJU/LD で公開されています。
Previous knowledge distillation (KD) methods for object detection mostly focus on feature imitation instead of mimicking the prediction logits due to its inefficiency in distilling the localization information. In this paper, we investigate whether logit mimicking always lags behind feature imitation. Towards this goal, we first present a novel localization distillation (LD) method which can efficiently transfer the localization knowledge from the teacher to the student. Second, we introduce the concept of valuable localization region that can aid to selectively distill the classification and localization knowledge for a certain region. Combining these two new components, for the first time, we show that logit mimicking can outperform feature imitation and the absence of localization distillation is a critical reason for why logit mimicking underperforms for years. The thorough studies exhibit the great potential of logit mimicking that can significantly alleviate the localization ambiguity, learn robust feature representation, and ease the training difficulty in the early stage. We also provide the theoretical connection between the proposed LD and the classification KD, that they share the equivalent optimization effect. Our distillation scheme is simple as well as effective and can be easily applied to both dense horizontal object detectors and rotated object detectors. Extensive experiments on the MS COCO, PASCAL VOC, and DOTA benchmarks demonstrate that our method can achieve considerable AP improvement without any sacrifice on the inference speed. Our source code and pretrained models are publicly available at https://github.com/HikariTJU/LD.
updated: Thu Dec 08 2022 01:55:12 GMT+0000 (UTC)
published: Tue Apr 12 2022 17:14:34 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト