arXiv reaDer
MogFace:顔検出のより深い理解に向けて
MogFace: Towards a Deeper Appreciation on Face Detection
一般的なオブジェクト検出器の先駆的な設計の恩恵を受けて、顔検出の分野で大きな成果が得られました。通常、顔検出器内のバックボーン、機能ピラミッドレイヤー、および検出ヘッドモジュールのアーキテクチャはすべて、一般的なオブジェクト検出器の優れたエクスペリエンスを取り入れています。ただし、ラベルの割り当てやスケールレベルのデータ拡張戦略など、いくつかの効果的な方法では、顔検出器に直接適用した場合に一貫した優位性を維持できません。具体的には、前者の戦略には膨大な数のハイパーパラメータが含まれ、後者の戦略には、一般化能力を制限するさまざまな検出タスク間のスケール分布バイアスの課題があります。さらに、顔の下流のタスクに正確な顔の境界ボックスを提供するために、顔検出器は、誤警報の排除を不可欠に要求します。結果として、顔検出器を進歩させるためには、ラベルの割り当て、スケールレベルのデータ拡張、および誤警報の低減に関する実用的なソリューションが必要です。この論文では、既存の方法を終了するのが難しいという前述の3つの課題を解決し、MogFaceと呼ばれる新しい顔検出器を提示することに焦点を当てます。 Mogfaceでは、顔検出器のパフォーマンスを向上させるために、Adaptive Online Incremental Anchor Mining Strategy、Selective Scale Enhancement Strategy、HierarchicalContext-AwareModuleの3つの主要コンポーネントが個別に提案されています。最後に、私たちの知る限り、MogFaceはWider Faceリーダーボードで最高の顔検出器であり、さまざまなテストシナリオですべてのチャンピオンを獲得しています。コードはhttps://github.com/damo-cv/MogFaceで入手できます。
Benefiting from the pioneering design of generic object detectors, significant achievements have been made in the field of face detection. Typically, the architectures of the backbone, feature pyramid layer, and detection head module within the face detector all assimilate the excellent experience from general object detectors. However, several effective methods, including label assignment and scale-level data augmentation strategy, fail to maintain consistent superiority when applying on the face detector directly. Concretely, the former strategy involves a vast body of hyper-parameters and the latter one suffers from the challenge of scale distribution bias between different detection tasks, which both limit their generalization abilities. Furthermore, in order to provide accurate face bounding boxes for facial down-stream tasks, the face detector imperatively requires the elimination of false alarms. As a result, practical solutions on label assignment, scale-level data augmentation, and reducing false alarms are necessary for advancing face detectors. In this paper, we focus on resolving three aforementioned challenges that exiting methods are difficult to finish off and present a novel face detector, termed MogFace. In our Mogface, three key components, Adaptive Online Incremental Anchor Mining Strategy, Selective Scale Enhancement Strategy and Hierarchical Context-Aware Module, are separately proposed to boost the performance of face detectors. Finally, to the best of our knowledge, our MogFace is the best face detector on the Wider Face leader-board, achieving all champions across different testing scenarios. The code is available at https://github.com/damo-cv/MogFace.
updated: Tue Mar 29 2022 07:00:26 GMT+0000 (UTC)
published: Sat Mar 20 2021 09:17:04 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト