arXiv reaDer
手話における音韻パラメータの分類
Classification of Phonological Parameters in Sign Languages
署名者は、手型、向き、位置、動き、非手動機能などの音韻パラメータを組み合わせることでコミュニケーションを可能にする手話音素を作成します。言語学の研究では、手話を構成要素に分解して手話を研究することが多く、ビデオの注釈に多くの労力が費やされることがよくあります。この作業では、言語注釈を支援するか、手話認識モデルの記号を記述することを目的として、単一のモデルを使用して手話内の個々の音韻パラメーターを認識する方法を示します。デンマーク手話データセット`Ordbogover Dansk Tegnsprog'を使用して、ポーズ推定モデルを使用して複数のデータセットを生成します。これらのデータセットは、マルチラベルモデリングをサポートするマルチラベルFastR-CNNモデルのトレーニングに使用されます。さらに、生成されたデータの方向と位置の音韻パラメーターの間に有意な共依存関係があることを示し、この共依存関係をモデルに組み込んでパフォーマンスを向上させます。
Signers compose sign language phonemes that enable communication by combining phonological parameters such as handshape, orientation, location, movement, and non-manual features. Linguistic research often breaks down signs into their constituent parts to study sign languages and often a lot of effort is invested into the annotation of the videos. In this work we show how a single model can be used to recognise the individual phonological parameters within sign languages with the aim of either to assist linguistic annotations or to describe the signs for the sign recognition models. We use Danish Sign Language data set `Ordbog over Dansk Tegnsprog' to generate multiple data sets using pose estimation model, which are then used for training the multi-label Fast R-CNN model to support multi-label modelling. Moreover, we show that there is a significant co-dependence between the orientation and location phonological parameters in the generated data and we incorporate this co-dependence in the model to achieve better performance.
updated: Tue May 24 2022 13:40:45 GMT+0000 (UTC)
published: Tue May 24 2022 13:40:45 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト