arXiv reaDer
End-to-End Optical Character Recognition for Bengali Handwritten Words
光学式文字認識(OCR)は、ドキュメント画像を使用してアナログドキュメントをデジタルに変換するプロセスです。現在、さまざまな言語の手書きおよび印刷されたコピーの両方に対して、多くの商用および非商用のOCRシステムが存在します。それにもかかわらず、ベンガル語を認識する場合に利用できる作品はほとんどありません。その中で、ほとんどの作品は印刷されたベンガル文字のOCRに焦点を当てていました。このホワイトペーパーでは、ベンガル語のエンドツーエンドのOCRシステムを紹介します。提案されたアーキテクチャは、手書きの単語画像から手書きのベンガル語を認識するエンドツーエンドの戦略を実装しています。 DenseNet、Xception、NASNet、MobileNetなどの一般的な畳み込みニューラルネットワーク(CNN)アーキテクチャを実験して、OCRアーキテクチャを構築します。さらに、2つの異なるリカレントニューラルネットワーク(RNN)メソッド、LSTMとGRUを実験します。提案されたアーキテクチャを、ピアレビューされたベンガル語の手書き画像データセットであるBanglaWrittingデータセットを使用して評価します。提案された方法は、GRU反復層を備えたDenseNet121モデルを使用して実行された0.091文字エラー率と0.273ワードエラー率を達成します。
Optical character recognition (OCR) is a process of converting analogue documents into digital using document images. Currently, many commercial and non-commercial OCR systems exist for both handwritten and printed copies for different languages. Despite this, very few works are available in case of recognising Bengali words. Among them, most of the works focused on OCR of printed Bengali characters. This paper introduces an end-to-end OCR system for Bengali language. The proposed architecture implements an end to end strategy that recognises handwritten Bengali words from handwritten word images. We experiment with popular convolutional neural network (CNN) architectures, including DenseNet, Xception, NASNet, and MobileNet to build the OCR architecture. Further, we experiment with two different recurrent neural networks (RNN) methods, LSTM and GRU. We evaluate the proposed architecture using BanglaWritting dataset, which is a peer-reviewed Bengali handwritten image dataset. The proposed method achieves 0.091 character error rate and 0.273 word error rate performed using DenseNet121 model with GRU recurrent layer.
updated: Sun May 09 2021 20:48:56 GMT+0000 (UTC)
published: Sun May 09 2021 20:48:56 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト