最先端の深顔認識方法は、ほとんどがソフトマックスベースのマルチクラス分類フレームワークでトレーニングされています。人気があり効果的であるにもかかわらず、これらの方法には、経験的なパフォーマンスを制限するいくつかの欠点があります。このホワイトペーパーでは、既存のマルチクラス分類フレームワークでのトレーニングと評価の不一致を特定することから始め、次にソフトマックス正規化の「競合」の性質によって引き起こされる潜在的な制限について説明します。これらの制限に動機付けられて、SphereFace2と呼ばれる新しい二項分類トレーニングフレームワークを提案します。既存の方法とは対照的に、SphereFace2は、softmax正規化、および対応する閉集合の仮定を回避します。これにより、トレーニングと評価の間のギャップが効果的に埋められ、各バイナリ分類タスクによって表現を個別に改善できるようになります。特定のパフォーマンスの高い損失関数を設計することに加えて、この「1対すべて」のバイナリ分類フレームワークのいくつかの一般的な原則を要約して、現在の競合する方法よりも優れたパフォーマンスを発揮できるようにします。人気のあるベンチマークでの私たちの実験は、SphereFace2が常に最先端の深顔認識方法をしのぐことができることを示しています。コードは公開されています。
State-of-the-art deep face recognition methods are mostly trained with a softmax-based multi-class classification framework. Despite being popular and effective, these methods still have a few shortcomings that limit empirical performance. In this paper, we start by identifying the discrepancy between training and evaluation in the existing multi-class classification framework and then discuss the potential limitations caused by the "competitive" nature of softmax normalization. Motivated by these limitations, we propose a novel binary classification training framework, termed SphereFace2. In contrast to existing methods, SphereFace2 circumvents the softmax normalization, as well as the corresponding closed-set assumption. This effectively bridges the gap between training and evaluation, enabling the representations to be improved individually by each binary classification task. Besides designing a specific well-performing loss function, we summarize a few general principles for this "one-vs-all" binary classification framework so that it can outperform current competitive methods. Our experiments on popular benchmarks demonstrate that SphereFace2 can consistently outperform state-of-the-art deep face recognition methods. The code has been made publicly available.