arXiv reaDer
連続 BSL 認識のための単語レベルのバングラ手話データセット
Word level Bangla Sign Language Dataset for Continuous BSL Recognition
堅牢な手話認識システムは、特に口頭でのコミュニケーションに苦労している人々にとって、コミュニケーションの障壁を大幅に軽減できます。これは、思考、感情、アイデアの表現を可能にするため、人間の成長と進歩にとって非常に重要です。ただし、標識認識は複雑なタスクであり、複数の標識に対する同じジェスチャー パターン、照明、服装、持ち運びの状態、大きなポーズの存在、異なるビュー間での照明の不一致など、多くの課題に直面しています。さらに、広範なバングラ語の手話ビデオ データセットがないため、特にディープ ラーニング技術を利用する場合、認識システムの操作がさらに困難になります。この問題に対処するために、まず、MVBSL-W50 と呼ばれる大規模なデータセットを作成しました。これは、13 のカテゴリにわたる 50 の孤立した単語で構成されています。次に、手話でコミュニケーションをとる個人の姿勢情報の時間的ダイナミクスをキャプチャする、注意ベースの Bi-GRU モデルを開発しました。提案されたモデルは、手話パターンの分析に成功している人間のポーズ情報を利用しています。動きの情報のみに注目し、身体の外観や環境要因を無視することで、モデルは単純化され、より高速なパフォーマンスを実現できます。モデルの精度は 85.64% と報告されています。
An robust sign language recognition system can greatly alleviate communication barriers, particularly for people who struggle with verbal communication. This is crucial for human growth and progress as it enables the expression of thoughts, feelings, and ideas. However, sign recognition is a complex task that faces numerous challenges such as same gesture patterns for multiple signs, lighting, clothing, carrying conditions, and the presence of large poses, as well as illumination discrepancies across different views. Additionally, the absence of an extensive Bangla sign language video dataset makes it even more challenging to operate recognition systems, particularly when utilizing deep learning techniques. In order to address this issue, firstly, we created a large-scale dataset called the MVBSL-W50, which comprises 50 isolated words across 13 categories. Secondly, we developed an attention-based Bi-GRU model that captures the temporal dynamics of pose information for individuals communicating through sign language. The proposed model utilizes human pose information, which has shown to be successful in analyzing sign language patterns. By focusing solely on movement information and disregarding body appearance and environmental factors, the model is simplified and can achieve a speedier performance. The accuracy of the model is reported to be 85.64%.
updated: Sun Apr 09 2023 18:48:21 GMT+0000 (UTC)
published: Wed Feb 22 2023 18:55:54 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト