arXiv reaDer
Inception v3を使用した顔の形状分類
Face shape classification using Inception v3
 本稿では、人間の顔の画像を5つの基本的な顔の形状のいずれかに分類する際に、Inception v3モデルの最後の層を再トレーニングして得られた実験結果を示します。再訓練されたInception v3モデルの精度を、顔のランドマークの距離比と角度を特徴として使用する次の分類方法の精度と比較しました:線形判別分析(LDA)、線形カーネルを備えたサポートベクターマシン(SVM-LIN)、サポートベクターマシン動径基底関数カーネル(SVM-RBF)、人工ニューラルネットワークまたは多層パーセプトロン(MLP)、およびk最近傍(KNN)。すべての分類子は、インターネットから収集された既知の顔の形をした女性有名人の合計500枚の画像を使用してトレーニングおよびテストされました。結果は、トレーニングの精度と全体の精度が、Inception v3では98.0%から100%、84.4%から84.8%、他の分類器では使用するトレーニングセットサイズに応じて50.6%から73.0%、36.4%から64.6%の範囲であることを示しています。この結果は、再トレーニングされたInception v3モデルがトレーニングデータにうまく適合し、モデルトレーニングに含める特定の機能を選択する必要なく、他の分類器よりも優れていることを示しています。将来の作業では、適切なモデルの相互検証を実行できるように、ラベル付きデータセット、できれば研究コミュニティに自由に配布できるデータセットを拡張することを検討する必要があります。私たちが知る限り、これは顔の形の分類に畳み込みニューラルネットワークを使用する最初の文献です。スクリプトはで入手できます。
In this paper, we present experimental results obtained from retraining the last layer of the Inception v3 model in classifying images of human faces into one of five basic face shapes. The accuracy of the retrained Inception v3 model was compared with that of the following classification methods that uses facial landmark distance ratios and angles as features: linear discriminant analysis (LDA), support vector machines with linear kernel (SVM-LIN), support vector machines with radial basis function kernel (SVM-RBF), artificial neural networks or multilayer perceptron (MLP), and k-nearest neighbors (KNN). All classifiers were trained and tested using a total of 500 images of female celebrities with known face shapes collected from the Internet. Results show that training accuracy and overall accuracy ranges from 98.0% to 100% and from 84.4% to 84.8% for Inception v3 and from 50.6% to 73.0% and from 36.4% to 64.6% for the other classifiers depending on the training set size used. This result shows that the retrained Inception v3 model was able to fit the training data well and outperform the other classifiers without the need to handpick specific features to include in model training. Future work should consider expanding the labeled dataset, preferably one that can also be freely distributed to the research community, so that proper model cross-validation can be performed. As far as we know, this is the first in the literature to use convolutional neural networks in face-shape classification. The scripts are available at
updated: Fri Nov 15 2019 02:29:59 GMT+0000 (UTC)
published: Fri Nov 15 2019 02:29:59 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト