arXiv reaDer
極周波数特徴に基づく顔認識
Face Recognition Based on Polar Frequency Features
 極周波数に基づいた、生物学的に動機付けられた新しい顔認識アルゴリズムが提示されます。極周波数記述子は、フーリエベッセル変換(FBT)によって顔画像から抽出されます。次に、すべての画像間のユークリッド距離が計算され、各画像は他の画像との非類似性によって表されます。疑似フィッシャー線形判別は、この非類似度空間に基づいて構築されました。離散フーリエ変換(DFT)記述子、および両方の機能タイプの組み合わせのパフォーマンスも評価されました。アルゴリズムは、40人と1196人の被験者の顔データベース(それぞれORLとFERET)でテストされました。トレーニングデータセットとテストデータセットの被験者ごとに5つの画像がある場合、ORLデータベースのエラー率は、FBT、DFT、および組み合わせ分類器でそれぞれ3.8、1.25、0.2%でしたが、これまでの最良のアルゴリズムでは2.6%でした。最も有益な極周波数機能は、低ラジアル周波数と結合した低から中角周波数に集中していました。アフィン正規化前処理が適用されたFERETデータベースでは、ランク認識テストでFBTアルゴリズムがPCAのみを上回りました。ただし、検証テストで評価すると、最先端の方法に匹敵するパフォーマンスを達成しました。これらの結果は、認識および検証タスクに関連する顔画像の極周波数コンテンツの情報価値が高いこと、およびデカルト周波数コンテンツが対象の身元に関する情報を補完できることを示していますが、おそらく画像が事前正規化されていない場合のみです。人間の顔認識の可能な影響について説明します。
A novel biologically motivated face recognition algorithm based on polar frequency is presented. Polar frequency descriptors are extracted from face images by Fourier-Bessel transform (FBT). Next, the Euclidean distance between all images is computed and each image is now represented by its dissimilarity to the other images. A Pseudo-Fisher Linear Discriminant was built on this dissimilarity space. The performance of Discrete Fourier transform (DFT) descriptors, and a combination of both feature types was also evaluated. The algorithms were tested on a 40- and 1196-subjects face database (ORL and FERET, respectively). With 5 images per subject in the training and test datasets, error rate on the ORL database was 3.8, 1.25 and 0.2% for the FBT, DFT, and the combined classifier, respectively, as compared to 2.6% achieved by the best previous algorithm. The most informative polar frequency features were concentrated at low-to-medium angular frequencies coupled to low radial frequencies. On the FERET database, where an affine normalization pre-processing was applied, the FBT algorithm outperformed only the PCA in a rank recognition test. However, it achieved performance comparable to state-of-the-art methods when evaluated by verification tests. These results indicate the high informative value of the polar frequency content of face images in relation to recognition and verification tasks, and that the Cartesian frequency content can complement information about the subjects' identity, but possibly only when the images are not pre-normalized. Possible implications for human face recognition are discussed.
updated: Tue Sep 27 2005 15:50:27 GMT+0000 (UTC)
published: Tue Sep 27 2005 15:50:27 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト