arXiv reaDer
MultiFace:顔認識パフォーマンスを向上させるための一般的なトレーニングメカニズム
MultiFace: A Generic Training Mechanism for Boosting Face Recognition Performance
ディープ畳み込みニューラルネットワーク(DCNN)とそのバリアントは、最近、大規模な顔認識(FR)で広く使用されています。既存の方法は、多くのFRベンチマークで良好なパフォーマンスを達成しています。しかし、それらのほとんどは2つの大きな問題に苦しんでいます。まず、これらの方法は、高次元でスパースなガウス球の損失関数を最適化するため、収束が非常に遅くなります。第二に、特徴の高次元性は、強力な記述能力にもかかわらず、最適化を困難にし、それが次善の局所最適化につながる可能性があります。これらの問題に対処するために、MultiFaceと呼ばれるシンプルで効率的なトレーニングメカニズムを提案します。このメカニズムでは、元の高次元の特徴を低次元の特徴のアンサンブルで近似します。提案されたメカニズムも一般的であり、多くの高度なFRモデルに簡単に適用できます。さらに、クラスタリング効果を介してFRモデルに優れた解釈可能性の利点をもたらします。詳細には、これらの低次元の特徴のアンサンブルは、補完的でありながら識別可能な情報をキャプチャでき、クラス内のコンパクトさとクラス間の分離可能性を高めることができます。実験結果は、提案されたメカニズムが、いくつかのベンチマークデータセットで最先端のパフォーマンスを達成しながら、ソフトマックス損失で2〜3倍、ArcfaceまたはCosfaceで1.2〜1.5倍加速できることを示しています。特に、大規模なデータセット(IJBやMageFaceなど)の大幅な改善は、新しいトレーニングメカニズムの柔軟性を示しています。
Deep Convolutional Neural Networks (DCNNs) and their variants have been widely used in large scale face recognition(FR) recently. Existing methods have achieved good performance on many FR benchmarks. However, most of them suffer from two major problems. First, these methods converge quite slowly since they optimize the loss functions in a high-dimensional and sparse Gaussian Sphere. Second, the high dimensionality of features, despite the powerful descriptive ability, brings difficulty to the optimization, which may lead to a sub-optimal local optimum. To address these problems, we propose a simple yet efficient training mechanism called MultiFace, where we approximate the original high-dimensional features by the ensemble of low-dimensional features. The proposed mechanism is also generic and can be easily applied to many advanced FR models. Moreover, it brings the benefits of good interpretability to FR models via the clustering effect. In detail, the ensemble of these low-dimensional features can capture complementary yet discriminative information, which can increase the intra-class compactness and inter-class separability. Experimental results show that the proposed mechanism can accelerate 2-3 times with the softmax loss and 1.2-1.5 times with Arcface or Cosface, while achieving state-of-the-art performances in several benchmark datasets. Especially, the significant improvements on large-scale datasets(e.g., IJB and MageFace) demonstrate the flexibility of our new training mechanism.
updated: Fri Jun 25 2021 06:08:49 GMT+0000 (UTC)
published: Mon Jan 25 2021 05:18:51 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト