arXiv reaDer
時間畳み込みネットワークによる手話セグメンテーション
Sign language segmentation with temporal convolutional networks
この作業の目的は、連続手話ビデオの標識間の時間的境界の位置を決定することです。私たちのアプローチは、符号境界キュー間のあいまいさを解決するために、反復的な時間セグメントの改良を伴う3D畳み込みニューラルネットワーク表現を採用しています。 BSLCORPUS、PHOENIX14、およびBSL-1Kデータセットに対するアプローチの有効性を示し、以前の最先端技術に比べて大幅な改善と、新しい署名者、言語、およびドメインに一般化する機能を示しています。
The objective of this work is to determine the location of temporal boundaries between signs in continuous sign language videos. Our approach employs 3D convolutional neural network representations with iterative temporal segment refinement to resolve ambiguities between sign boundary cues. We demonstrate the effectiveness of our approach on the BSLCORPUS, PHOENIX14 and BSL-1K datasets, showing considerable improvement over the prior state of the art and the ability to generalise to new signers, languages and domains.
updated: Wed Nov 25 2020 19:11:48 GMT+0000 (UTC)
published: Wed Nov 25 2020 19:11:48 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト