arXiv reaDer
Content4All OpenResearch手話翻訳データセット
Content4All Open Research Sign Language Translation Datasets
計算手話研究には、有用な実際のアプリケーションの作成を可能にする大規模なデータセットがありません。今日まで、ほとんどの研究は、天気予報などの論議領界の小さな領域でのプロトタイプシステムに限定されてきました。この問題に対処し、この分野を前進させるために、ニュースのより大きな領域で190時間の映像で構成される6つのデータセットをリリースします。このことから、20時間の映像が聴覚障害者の専門家と通訳によって注釈が付けられ、研究目的で公開されています。このホワイトペーパーでは、手話のビデオと字幕の調整を可能にするために開発されたデータセット収集プロセスとツール、および将来の研究を支えるためのベースライン翻訳結果を共有します。
Computational sign language research lacks the large-scale datasets that enables the creation of useful reallife applications. To date, most research has been limited to prototype systems on small domains of discourse, e.g. weather forecasts. To address this issue and to push the field forward, we release six datasets comprised of 190 hours of footage on the larger domain of news. From this, 20 hours of footage have been annotated by Deaf experts and interpreters and is made publicly available for research purposes. In this paper, we share the dataset collection process and tools developed to enable the alignment of sign language video and subtitles, as well as baseline translation results to underpin future research.
updated: Wed May 05 2021 22:14:53 GMT+0000 (UTC)
published: Wed May 05 2021 22:14:53 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト