arXiv reaDer
Dynamic Class Queue for Large Scale Face Recognition In the Wild
野生の大規模な顔データセットを使用して識別表現を学習することは、実際のアプリケーションにとって非常に重要ですが、それでも困難なままです。困難は多くの側面にあり、この作業はリソースの制約とロングテールのクラス分散の計算に焦点を合わせています。最近、ディープニューラルネットワークと適切に設計された損失を使用した分類ベースの表現学習により、優れた認識パフォーマンスが実証されました。ただし、コンピューティングとメモリのコストは、トレーニングセット内のID(クラス)の数に比例して増加し、学習プロセスは不均衡なクラスに悩まされます。この作業では、これら2つの問題に取り組むための動的クラスキュー(DCQ)を提案します。具体的には、トレーニング中の反復ごとに、認識用のクラスのサブセットが動的に選択され、それらのクラスの重みがオンザフライで動的に生成され、キューに格納されます。反復ごとにクラスのサブセットのみが選択されるため、計算要件が軽減されます。モデルを並列化せずに単一のサーバーを使用することにより、大規模なデータセットで、すべてのクラスを使用する場合と同様のパフォーマンスを達成するには、クラスの10%で十分であることを経験的に検証します。さらに、クラスの重みは数ショットの方法で動的に生成されるため、インスタンスが少ないテールクラスに適しています。 672KのIDを持つ最大の公開データセットMegafaceChallenge2(MF2)で、強力なベースラインを超える明らかな改善が見られ、それらの88%以上が10未満のインスタンスを持っています。コードはで入手できます
Learning discriminative representation using large-scale face datasets in the wild is crucial for real-world applications, yet it remains challenging. The difficulties lie in many aspects and this work focus on computing resource constraint and long-tailed class distribution. Recently, classification-based representation learning with deep neural networks and well-designed losses have demonstrated good recognition performance. However, the computing and memory cost linearly scales up to the number of identities (classes) in the training set, and the learning process suffers from unbalanced classes. In this work, we propose a dynamic class queue (DCQ) to tackle these two problems. Specifically, for each iteration during training, a subset of classes for recognition are dynamically selected and their class weights are dynamically generated on-the-fly which are stored in a queue. Since only a subset of classes is selected for each iteration, the computing requirement is reduced. By using a single server without model parallel, we empirically verify in large-scale datasets that 10% of classes are sufficient to achieve similar performance as using all classes. Moreover, the class weights are dynamically generated in a few-shot manner and therefore suitable for tail classes with only a few instances. We show clear improvement over a strong baseline in the largest public dataset Megaface Challenge2 (MF2) which has 672K identities and over 88% of them have less than 10 instances. Code is available at
updated: Mon May 24 2021 06:31:10 GMT+0000 (UTC)
published: Mon May 24 2021 06:31:10 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト