arXiv reaDer
SELM:フェイスバイオメトリクスへの応用を備えたシャムエクストリームラーニングマシン
SELM: Siamese Extreme Learning Machine with Application to Face Biometrics
Extreme Learning Machineは、非常に競争力のある既存の分類方法である強力な分類方法です。トレーニングは非常に高速です。それにもかかわらず、顔検証タスクは、2人の個人の顔画像を同時に比較し、2つの顔が同じ人物を識別するかどうかを判断する必要があるため、顔検証タスクを適切に実行できません。 Extreme Leaning Machineの構造は、2つの入力データストリームを同時に供給するようには設計されていません。したがって、2入力シナリオでは、Extreme LearningMachineメソッドは通常連結入力を使用して適用されます。ただし、この設定は2倍の計算リソースを消費し、分離可能な距離メトリックの学習が重要な認識タスクには最適化されていません。これらの理由から、シャムエクストリームラーニングマシン(SELM)を提案および開発しています。 SELMは、2つのデータストリームを同時に並列に供給するように設計されています。追加のシャムレイヤーでデュアルストリームシャム条件を利用して、データを非表示レイヤーに渡す前に変換します。さらに、さまざまな特定の人口統計グループでのみトレーニングされた、性別-民族-依存のトリプレット機能を提案します。この機能により、各グループの有用な顔の特徴を学習および抽出できます。実験は、SELM、Extreme Learning Machine、およびDCNNのパフォーマンスを評価および比較するために実施されました。実験結果は、提案された機能が97.87%の精度と99.45%のAUCで正しい分類を実行できることを示しました。彼らはまた、提案された機能と組み合わせてSELMを使用すると、98.31%の精度と99.72%のAUCが提供されることを示しました。それらは、よく知られているDCNNおよびExtreme LeaningMachineメソッドを大幅に上回りました。
Extreme Learning Machine is a powerful classification method very competitive existing classification methods. It is extremely fast at training. Nevertheless, it cannot perform face verification tasks properly because face verification tasks require comparison of facial images of two individuals at the same time and decide whether the two faces identify the same person. The structure of Extreme Leaning Machine was not designed to feed two input data streams simultaneously, thus, in 2-input scenarios Extreme Learning Machine methods are normally applied using concatenated inputs. However, this setup consumes two times more computational resources and it is not optimized for recognition tasks where learning a separable distance metric is critical. For these reasons, we propose and develop a Siamese Extreme Learning Machine (SELM). SELM was designed to be fed with two data streams in parallel simultaneously. It utilizes a dual-stream Siamese condition in the extra Siamese layer to transform the data before passing it along to the hidden layer. Moreover, we propose a Gender-Ethnicity-Dependent triplet feature exclusively trained on a variety of specific demographic groups. This feature enables learning and extracting of useful facial features of each group. Experiments were conducted to evaluate and compare the performances of SELM, Extreme Learning Machine, and DCNN. The experimental results showed that the proposed feature was able to perform correct classification at 97.87% accuracy and 99.45% AUC. They also showed that using SELM in conjunction with the proposed feature provided 98.31% accuracy and 99.72% AUC. They outperformed the well-known DCNN and Extreme Leaning Machine methods by a wide margin.
updated: Fri Aug 06 2021 14:19:10 GMT+0000 (UTC)
published: Fri Aug 06 2021 14:19:10 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト