arXiv reaDer
PKD:ピアソン相関係数によるオブジェクト検出器の一般的な蒸留フレームワーク
PKD: General Distillation Framework for Object Detectors via Pearson Correlation Coefficient
知識蒸留(KD)は、オブジェクト検出でコンパクトなモデルをトレーニングするために広く使用されている手法です。ただし、異種の検出器間で蒸留する方法についてはまだ研究が不足しています。この論文では、検出ヘッドとラベルの割り当ては異なりますが、異種の教師検出器からのより優れたFPN機能が生徒を支援できることを経験的に発見しました。ただし、特徴マップを蒸留検出器に直接位置合わせすることには、2つの問題があります。まず、教師と生徒の特徴の大きさの違いにより、生徒に過度に厳しい制約が課せられる可能性があります。第二に、教師モデルからの大きな特徴の大きさを持つFPNステージとチャネルは、蒸留損失の勾配を支配する可能性があり、KDの他の特徴の効果を圧倒し、多くのノイズを導入します。上記の問題に対処するために、ピアソン相関係数を使用して特徴を模倣し、教師からの関係情報に焦点を当て、特徴の大きさに対する制約を緩和することを提案します。私たちの方法は、既存の検出KD方法を一貫して上回り、同種および異種の生徒と教師のペアの両方で機能します。さらに、収束が速くなります。強力なMaskRCNN-Swin検出器を教師として使用することで、ResNet-50ベースのRetinaNetとFCOSは、COCO2017でそれぞれ41.5%と43.9%のmAPを達成し、ベースラインよりもそれぞれ4.1%と4.8%高くなっています。
Knowledge distillation(KD) is a widely-used technique to train compact models in object detection. However, there is still a lack of study on how to distill between heterogeneous detectors. In this paper, we empirically find that better FPN features from a heterogeneous teacher detector can help the student although their detection heads and label assignments are different. However, directly aligning the feature maps to distill detectors suffers from two problems. First, the difference in feature magnitude between the teacher and the student could enforce overly strict constraints on the student. Second, the FPN stages and channels with large feature magnitude from the teacher model could dominate the gradient of distillation loss, which will overwhelm the effects of other features in KD and introduce much noise. To address the above issues, we propose to imitate features with Pearson Correlation Coefficient to focus on the relational information from the teacher and relax constraints on the magnitude of the features. Our method consistently outperforms the existing detection KD methods and works for both homogeneous and heterogeneous student-teacher pairs. Furthermore, it converges faster. With a powerful MaskRCNN-Swin detector as the teacher, ResNet-50 based RetinaNet and FCOS achieve 41.5% and 43.9% mAP on COCO2017, which are 4.1% and 4.8% higher than the baseline, respectively.
updated: Tue Jul 05 2022 13:37:34 GMT+0000 (UTC)
published: Tue Jul 05 2022 13:37:34 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト