arXiv reaDer
手書き認識用のテキスト行画像のコンテンツとスタイルを意識した生成
Content and Style Aware Generation of Text-line Images for Handwriting Recognition
手書きテキスト認識は、公開ベンチマークで印象的なパフォーマンスを達成しました。ただし、手書きスタイル間のクラス間およびクラス内のばらつきが大きいため、このような認識機能は、手動でラベル付けされた大量のトレーニングデータを使用してトレーニングする必要があります。この手間のかかる問題を軽減するために、TrueTypeフォントで生成された合成データは、ボリュームを増やし、手書きスタイルのばらつきを増やすために、トレーニングループでよく使用されてきました。ただし、合成データと実際のデータの間には、認識パフォーマンスの向上を妨げる大きなスタイルの偏りがあります。このような制限に対処するために、視覚的外観とテキストコンテンツの両方を条件とする手書きテキスト行画像の生成方法を提案します。私たちの方法では、さまざまな手書きスタイルの長いテキスト行のサンプルを作成できます。適切にトレーニングされると、ラベルのないテキスト行の画像にアクセスするだけで、手書きのスタイルを模倣し、テキストコンテンツを含む画像を生成することで、新しいターゲットデータにこの方法を適応させることもできます。生成されたサンプルを使用して手書きテキスト認識のパフォーマンスを向上させるために、広範な実験が行われました。定性的および定量的結果の両方が、提案されたアプローチが現在の最先端技術を上回っていることを示しています。
Handwritten Text Recognition has achieved an impressive performance in public benchmarks. However, due to the high inter- and intra-class variability between handwriting styles, such recognizers need to be trained using huge volumes of manually labeled training data. To alleviate this labor-consuming problem, synthetic data produced with TrueType fonts has been often used in the training loop to gain volume and augment the handwriting style variability. However, there is a significant style bias between synthetic and real data which hinders the improvement of recognition performance. To deal with such limitations, we propose a generative method for handwritten text-line images, which is conditioned on both visual appearance and textual content. Our method is able to produce long text-line samples with diverse handwriting styles. Once properly trained, our method can also be adapted to new target data by only accessing unlabeled text-line images to mimic handwritten styles and produce images with any textual content. Extensive experiments have been done on making use of the generated samples to boost Handwritten Text Recognition performance. Both qualitative and quantitative results demonstrate that the proposed approach outperforms the current state of the art.
updated: Tue Apr 12 2022 05:52:03 GMT+0000 (UTC)
published: Tue Apr 12 2022 05:52:03 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト