Boosting Semi-Supervised Face Recognition with Noise Robustness
深い顔認識は大規模なトレーニングデータから大きな恩恵を受けますが、現在のボトルネックはラベリングコストです。この問題の実行可能な解決策は、半教師あり学習であり、ラベル付きデータのごく一部とラベルなしデータの大量を活用します。ただし、主な課題は、自動ラベル付けによるラベルエラーの蓄積であり、トレーニングが損なわれます。この論文は、自動ラベリングによって引き起こされるラベルノイズに対してロバストな半教師あり顔認識への効果的な解決策を提示します。具体的には、GroupNet(GN)という名前のマルチエージェントメソッドを導入して、誤ってラベル付けされたサンプルを識別し、クリーンなサンプルを保持する機能をソリューションに提供します。ノイズの多いラベルがトレーニングデータの50%を超える場合でも、GNだけで従来の教師あり顔認識で最高の精度を達成することを示します。さらに、GNによって強化された堅牢なトレーニング能力に基づいたNoise Robust Learning-Labelling(NRoLL)という名前の半教師あり顔認識ソリューションを開発します。少量のラベル付きデータから開始し、その結果、大量のラベルなしデータに対して信頼性の高いラベル付けを実行して、さらなるトレーニングを促進します。 NRoLLによってラベル付けされるデータが多いほど、データセット内のラベルの信頼性が高くなります。この方法の競争力を評価するために、ラベル付きMSCelebの5分の1のみが使用可能で、残りはラベルなしデータとして使用されるという大まかな条件でNRoLLを実行します。幅広いベンチマークで、私たちの方法は最先端の方法と比べて遜色ありません。
Although deep face recognition benefits significantly from large-scale training data, a current bottleneck is the labelling cost. A feasible solution to this problem is semi-supervised learning, exploiting a small portion of labelled data and large amounts of unlabelled data. The major challenge, however, is the accumulated label errors through auto-labelling, compromising the training. This paper presents an effective solution to semi-supervised face recognition that is robust to the label noise aroused by the auto-labelling. Specifically, we introduce a multi-agent method, named GroupNet (GN), to endow our solution with the ability to identify the wrongly labelled samples and preserve the clean samples. We show that GN alone achieves the leading accuracy in traditional supervised face recognition even when the noisy labels take over 50% of the training data. Further, we develop a semi-supervised face recognition solution, named Noise Robust Learning-Labelling (NRoLL), which is based on the robust training ability empowered by GN. It starts with a small amount of labelled data and consequently conducts high-confidence labelling on a large amount of unlabelled data to boost further training. The more data is labelled by NRoLL, the higher confidence is with the label in the dataset. To evaluate the competitiveness of our method, we run NRoLL with a rough condition that only one-fifth of the labelled MSCeleb is available and the rest is used as unlabelled data. On a wide range of benchmarks, our method compares favorably against the state-of-the-art methods.
updated: Mon May 10 2021 14:43:11 GMT+0000 (UTC)
published: Mon May 10 2021 14:43:11 GMT+0000 (UTC)
