arXiv reaDer
堅牢なクロスレゾリューション顔認識のための階層型ディープCNN特徴セットベースの表現学習
Hierarchical Deep CNN Feature Set-Based Representation Learning for Robust Cross-Resolution Face Recognition
インテリジェント監視および生体認証フォレンジックで重要なクロス解像度顔認識(CRFR)は、低解像度(LR)プローブの顔画像を高解像度(HR)ギャラリーの顔画像と照合する問題を指します。既存の浅い学習ベースの方法と深い学習ベースの方法は、解像度の不一致が軽減される共同特徴空間にHR-LR面ペアをマッピングすることに焦点を当てています。ただし、解像度の制限による解像度の不一致をさらに軽減するために、ノイズの多いLRクエリ面から中間の識別機能を抽出して利用する方法を検討している作業はほとんどありません。この研究では、堅牢なCRFRのためにマルチレベルの深い畳み込みニューラルネットワーク(CNN)機能セットを十分に活用したいと考えています。特に、私たちの貢献は3つあります。 (i)より堅牢で識別力のある機能を学習するために、さまざまなレイヤーのコンテキスト機能を適応的に融合することを望んでいます。 (ii)これらのコンテキスト機能を十分に活用するために、機能セットベースの表現学習(FSRL)スキームを設計して、階層機能を協調的に表現し、より正確に認識できるようにします。さらに、FSRLは、特にノイズの多い場合に、潜在的な構造情報を保持するために特徴マップのプリミティブ形式を利用します。 (iii)認識性能をさらに向上させるために、異なる段階からの階層的な認識出力を融合させたいと考えています。一方、異なるスケールからの識別可能性も完全に統合することができます。これらの利点を活用することにより、提案された方法の効率を実現することができます。いくつかの顔データセットでの実験結果により、提示されたアルゴリズムが他の競合するCRFRアプローチよりも優れていることが確認されました。
Cross-resolution face recognition (CRFR), which is important in intelligent surveillance and biometric forensics, refers to the problem of matching a low-resolution (LR) probe face image against high-resolution (HR) gallery face images. Existing shallow learning-based and deep learning-based methods focus on mapping the HR-LR face pairs into a joint feature space where the resolution discrepancy is mitigated. However, little works consider how to extract and utilize the intermediate discriminative features from the noisy LR query faces to further mitigate the resolution discrepancy due to the resolution limitations. In this study, we desire to fully exploit the multi-level deep convolutional neural network (CNN) feature set for robust CRFR. In particular, our contributions are threefold. (i) To learn more robust and discriminative features, we desire to adaptively fuse the contextual features from different layers. (ii) To fully exploit these contextual features, we design a feature set-based representation learning (FSRL) scheme to collaboratively represent the hierarchical features for more accurate recognition. Moreover, FSRL utilizes the primitive form of feature maps to keep the latent structural information, especially in noisy cases. (iii) To further promote the recognition performance, we desire to fuse the hierarchical recognition outputs from different stages. Meanwhile, the discriminability from different scales can also be fully integrated. By exploiting these advantages, the efficiency of the proposed method can be delivered. Experimental results on several face datasets have verified the superiority of the presented algorithm to the other competitive CRFR approaches.
updated: Thu Mar 25 2021 14:03:42 GMT+0000 (UTC)
published: Thu Mar 25 2021 14:03:42 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト