arXiv reaDer
AttentionHTR:Attention Encoder-DecoderNetworksに基づく手書きテキスト認識
AttentionHTR: Handwritten Text Recognition Based on Attention Encoder-Decoder Networks
この作品は、手書きの単語認識のための注意ベースのシーケンス間モデルを提案し、HTRシステムのデータ効率の高いトレーニングのための転移学習を探求します。トレーニングデータの不足を克服するために、この作業では、手書き認識モデルを調整するための開始点として、シーンのテキスト画像で事前にトレーニングされたモデルを活用します。 ResNet特徴抽出と双方向LSTMベースのシーケンスモデリングステージが一緒になってエンコーダを形成します。予測段階は、デコーダーとコンテンツベースのアテンションメカニズムで構成されます。提案されたエンドツーエンドHTRシステムの有効性は、新しいマルチライターデータセットImgur5KとIAMデータセットで経験的に評価されています。実験結果は、HTRフレームワークのパフォーマンスを評価し、エラーケースの詳細な分析によってさらにサポートされます。ソースコードと事前トレーニング済みモデルは、https://github.com/dmitrijsk/AttentionHTRで入手できます。
This work proposes an attention-based sequence-to-sequence model for handwritten word recognition and explores transfer learning for data-efficient training of HTR systems. To overcome training data scarcity, this work leverages models pre-trained on scene text images as a starting point towards tailoring the handwriting recognition models. ResNet feature extraction and bidirectional LSTM-based sequence modeling stages together form an encoder. The prediction stage consists of a decoder and a content-based attention mechanism. The effectiveness of the proposed end-to-end HTR system has been empirically evaluated on a novel multi-writer dataset Imgur5K and the IAM dataset. The experimental results evaluate the performance of the HTR framework, further supported by an in-depth analysis of the error cases. Source code and pre-trained models are available at https://github.com/dmitrijsk/AttentionHTR.
updated: Sun Jan 23 2022 22:48:36 GMT+0000 (UTC)
published: Sun Jan 23 2022 22:48:36 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト