arXiv reaDer
垂直注意ネットワークを使用したエンドツーエンドの手書き段落テキスト認識
End-to-end Handwritten Paragraph Text Recognition Using a Vertical Attention Network
制約のない手書きのテキスト認識は、コンピュータビジョンシステムにとって依然として困難です。段落テキスト認識は、従来、2つのモデルによって実現されていました。1つ目は行のセグメンテーション用で、2つ目はテキスト行認識用です。このタスクに取り組むために、ハイブリッドアテンションを使用した統一されたエンドツーエンドモデルを提案します。このモデルは、段落画像を1行ずつ繰り返し処理するように設計されています。 3つのモジュールに分割できます。エンコーダーは、段落画像全体から特徴マップを生成します。次に、アテンションモジュールは、現在のテキスト行の特徴に焦点を合わせることができる垂直方向の重み付きマスクを繰り返し生成します。このようにして、一種の暗黙的なラインセグメンテーションを実行します。テキスト行の特徴ごとに、デコーダモジュールが関連付けられた文字シーケンスを認識し、段落全体を認識します。 3つの人気のあるデータセットで段落レベルで最先端の文字エラー率を達成しています:RIMESで1.91%、IAMで4.45%、READ 2016で3.59%。コードとトレーニング済みモデルの重みはhttps:// githubで入手できます。 .com / FactoDeepLearning / VerticalAttentionOCR。
Unconstrained handwritten text recognition remains challenging for computer vision systems. Paragraph text recognition is traditionally achieved by two models: the first one for line segmentation and the second one for text line recognition. We propose a unified end-to-end model using hybrid attention to tackle this task. This model is designed to iteratively process a paragraph image line by line. It can be split into three modules. An encoder generates feature maps from the whole paragraph image. Then, an attention module recurrently generates a vertical weighted mask enabling to focus on the current text line features. This way, it performs a kind of implicit line segmentation. For each text line features, a decoder module recognizes the character sequence associated, leading to the recognition of a whole paragraph. We achieve state-of-the-art character error rate at paragraph level on three popular datasets: 1.91% for RIMES, 4.45% for IAM and 3.59% for READ 2016. Our code and trained model weights are available at https://github.com/FactoDeepLearning/VerticalAttentionOCR.
updated: Fri Dec 03 2021 14:30:54 GMT+0000 (UTC)
published: Mon Dec 07 2020 17:31:20 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト