arXiv reaDer
連結されたBdSLネットワークを使用したバングラ手話認識
Bangla sign language recognition using concatenated BdSL network
手話は、聴覚障害者と聴覚障害者およびダムコミュニティのための唯一のコミュニケーション手段です。したがって、一般大衆とのコミュニケーションは、このマイノリティグループにとって常に課題です。特にバングラ手話(BdSL)には、38のアルファベットがあり、いくつかはほぼ同じ記号を持っています。その結果、BdSL認識では、従来の畳み込みニューラルネットワーク(CNN)から抽出された視覚的特徴に加えて、手の姿勢が重要な要素になります。本論文では、CNNベースの画像ネットワークと姿勢推定ネットワークからなる新しいアーキテクチャ「連結BdSLネットワーク」を提案した。画像ネットワークが視覚的特徴を取得している間、手のキーポイントの相対位置は、BdSLシンボルの複雑さに対処するための追加の特徴を取得するために、ポーズ推定ネットワークによって取得されます。テストセットでのこの新しいアプローチによって91.51%のスコアが達成され、追加のポーズ推定ネットワークの有効性が実験結果によって示唆されています。
Sign language is the only medium of communication for the hearing impaired and the deaf and dumb community. Communication with the general mass is thus always a challenge for this minority group. Especially in Bangla sign language (BdSL), there are 38 alphabets with some having nearly identical symbols. As a result, in BdSL recognition, the posture of hand is an important factor in addition to visual features extracted from traditional Convolutional Neural Network (CNN). In this paper, a novel architecture "Concatenated BdSL Network" is proposed which consists of a CNN based image network and a pose estimation network. While the image network gets the visual features, the relative positions of hand keypoints are taken by the pose estimation network to obtain the additional features to deal with the complexity of the BdSL symbols. A score of 91.51% was achieved by this novel approach in test set and the effectiveness of the additional pose estimation network is suggested by the experimental results.
updated: Sun Jul 25 2021 14:47:30 GMT+0000 (UTC)
published: Sun Jul 25 2021 14:47:30 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト