arXiv reaDer
DAIL:顔認識のためのデータセット対応の不変学習
DAIL: Dataset-Aware and Invariant Learning for Face Recognition
顔認識で優れたパフォーマンスを実現するには、通常、大規模なトレーニングデータセットが必要です。認識パフォーマンスを向上させる簡単で効果的な方法は、トレーニングで複数のデータセットを組み合わせて、できるだけ大きなデータセットを使用することです。ただし、2つの大きな問題があるため、異なるデータセットを単純に組み合わせるのは問題があり面倒です。まず、同じ人物が異なるデータセットに表示される可能性があり、異なるデータセット間でIDの重複の問題が発生する可能性があります。トレーニング中に同じ人物を異なるデータセットの異なるクラスとして素朴に扱うと、バックプロパゲーションに影響を与え、代表的でない埋め込みが生成されます。一方、ラベルを手動でクリーニングするには、特に数百万の画像と数千のIDがある場合、手ごわい人間の努力が必要になる場合があります。次に、さまざまなデータセットがさまざまな状況で収集されるため、さまざまなドメイン分布が発生します。データセットを単純に組み合わせると、異なるデータセット間でドメイン不変の埋め込みを学習することが困難になります。この論文では、上記の問題を解決するために、DAIL:データセット対応および不変学習を提案します。 IDの重複の最初の問題を解決するために、同じ人物が複数のデータセットに表示される場合のペナルティを減らすことにより、マルチデータセットトレーニングのデータセット認識損失を提案します。これは、データセット対応の項を使用して修正されたソフトマックス損失で簡単に達成できます。 2番目の問題を解決するために、勾配反転レイヤーを使用したドメイン適応がデータセット不変学習に採用されています。提案されたアプローチは、LFW、CFP-FP、AgeDB-30など、一般的に使用されるいくつかの顔認識検証セットで最先端の結果を達成するだけでなく、実用化にも大きなメリットを示します。
To achieve good performance in face recognition, a large scale training dataset is usually required. A simple yet effective way to improve recognition performance is to use a dataset as large as possible by combining multiple datasets in the training. However, it is problematic and troublesome to naively combine different datasets due to two major issues. First, the same person can possibly appear in different datasets, leading to an identity overlapping issue between different datasets. Naively treating the same person as different classes in different datasets during training will affect back-propagation and generate non-representative embeddings. On the other hand, manually cleaning labels may take formidable human efforts, especially when there are millions of images and thousands of identities. Second, different datasets are collected in different situations and thus will lead to different domain distributions. Naively combining datasets will make it difficult to learn domain invariant embeddings across different datasets. In this paper, we propose DAIL: Dataset-Aware and Invariant Learning to resolve the above-mentioned issues. To solve the first issue of identity overlapping, we propose a dataset-aware loss for multi-dataset training by reducing the penalty when the same person appears in multiple datasets. This can be readily achieved with a modified softmax loss with a dataset-aware term. To solve the second issue, domain adaptation with gradient reversal layers is employed for dataset invariant learning. The proposed approach not only achieves state-of-the-art results on several commonly used face recognition validation sets, including LFW, CFP-FP, and AgeDB-30, but also shows great benefit for practical use.
updated: Thu Jan 14 2021 01:59:52 GMT+0000 (UTC)
published: Thu Jan 14 2021 01:59:52 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト