arXiv reaDer
手書き速記認識の拡張手法に関する研究
A Study of Augmentation Methods for Handwritten Stenography Recognition
速記の手書きテキスト認識 (HTR) のパフォーマンスを制限する要因の 1 つは、少量の注釈付きトレーニング データです。データ不足の問題を軽減するために、最新の HTR メソッドではデータ拡張を採用することがよくあります。ただし、速記スクリプトの仕様により、そのような設定は速記認識に直接適用できない場合があります。この作業では、22 の古典的な拡張技術を研究します。そのほとんどは、ラテン語の手書きなど、他のスクリプトの HTR に一般的に使用されます。大規模な実験を通じて、速記認識のユースケースに有益なランダムな回転、シフト、およびスケーリングの範囲などを含む拡張のグループを特定します。さらに、認識性能の低下につながる多くの拡張アプローチが特定されています。私たちの結果は、統計的仮説検定によって裏付けられています。公開されているデータセットとコードベースへのリンクが提供されています。
One of the factors limiting the performance of handwritten text recognition (HTR) for stenography is the small amount of annotated training data. To alleviate the problem of data scarcity, modern HTR methods often employ data augmentation. However, due to specifics of the stenographic script, such settings may not be directly applicable for stenography recognition. In this work, we study 22 classical augmentation techniques, most of which are commonly used for HTR of other scripts, such as Latin handwriting. Through extensive experiments, we identify a group of augmentations, including for example contained ranges of random rotation, shifts and scaling, that are beneficial to the use case of stenography recognition. Furthermore, a number of augmentation approaches, leading to a decrease in recognition performance, are identified. Our results are supported by statistical hypothesis testing. Links to the publicly available dataset and codebase are provided.
updated: Sun Mar 05 2023 20:06:19 GMT+0000 (UTC)
published: Sun Mar 05 2023 20:06:19 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト