arXiv reaDer
MogFace:顔検出器のスケール拡張を再考する
MogFace: Rethinking Scale Augmentation on the Face Detector
顔検出器は、極端なスケール変動の課題に頻繁に直面します。有名なソリューションは、マルチスケールトレーニング、データアンカーサンプリング、およびランダム作物戦略です。この論文では、画像の前景と背景の情報、およびスケール情報を含む、以前のソリューション間の違いを調査することによって、極端なスケール分散問題を解決するための2つの重要な要素を示します。しかし、現在の優れたソリューションは、前者の情報を効果的に吸収することを怠りながら、前者の情報しか利用できません。検出器がスケール情報を効率的に利用できるようにするために、検出器の性能とトレーニングデータのスケール分布との関係を分析します。この分析に基づいて、これら2つの情報を効率的かつ同時に同化できるSelective Scale Enhancement(SSE)戦略を提案します。最後に、私たちの方法は、AFW、PASCAL顔、FDDB、Wider Faceデータセットなど、すべての一般的な顔検出ベンチマークで最先端の検出パフォーマンスを実現します。私たちの結果は、WiderFaceデータセットで6人のチャンピオンを達成していることに注意してください。
Face detector frequently confronts extreme scale variance challenge. The famous solutions are Multi-scale training, Data-anchor-sampling and Random crop strategy. In this paper, we indicate 2 significant elements to resolve extreme scale variance problem by investigating the difference among the previous solutions, including the fore-ground and back-ground information of an image and the scale information. However, current excellent solutions can only utilize the former information while neglecting to absorb the latter one effectively. In order to help the detector utilize the scale information efficiently, we analyze the relationship between the detector performance and the scale distribution of the training data. Based on this analysis, we propose a Selective Scale Enhancement (SSE) strategy which can assimilate these two information efficiently and simultaneously. Finally, our method achieves state-of-the-art detection performance on all common face detection benchmarks, including AFW, PASCAL face, FDDB and Wider Face datasets. Note that our result achieves six champions on the Wider Face dataset.
updated: Sat Mar 20 2021 09:17:04 GMT+0000 (UTC)
published: Sat Mar 20 2021 09:17:04 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト