arXiv reaDer
新しいトランスフォーマーベースのモデルと、分音記号付きの古典アラビア語の革新的な 2 億 7000 万語のマルチフォント コーパスを使用した堅牢なアラビア語手書き認識のためのエンドツーエンド OCR フレームワーク
An End-to-End OCR Framework for Robust Arabic-Handwriting Recognition using a Novel Transformers-based Model and an Innovative 270 Million-Words Multi-Font Corpus of Classical Arabic with Diacritics
この研究は、アラビア語の歴史的文書の光学式文字認識 (OCR) を開発し、さまざまなモデリング手順が問題とどのように相互作用するかを調べる一連の調査の第 2 段階です。最初の調査では、特注のアラビア語データセットに対するトランスフォーマーの影響を調査しました。最初の調査のマイナス面の 1 つは、トレーニング データのサイズでした。リソースが不足しているため、3,000 万枚の画像からわずか 15,000 枚の画像しかありませんでした。また、画像強化レイヤー、時間と空間の最適化、および修正後レイヤーを追加して、モデルが正しいコンテキストの正しい単語を予測するのを支援します。特に、Vision Transformer をエンコーダー (つまり BEIT) として使用し、Vanilla Transformer をデコーダーとして使用するエンドツーエンドのテキスト認識アプローチを提案し、特徴抽出のための CNN を排除し、モデルの複雑さを軽減します。実験では、エンド ツー エンド モデルが畳み込みバックボーンよりも優れていることが示されています。モデルは 4.46% の CER を達成しました。
This research is the second phase in a series of investigations on developing an Optical Character Recognition (OCR) of Arabic historical documents and examining how different modeling procedures interact with the problem. The first research studied the effect of Transformers on our custom-built Arabic dataset. One of the downsides of the first research was the size of the training data, a mere 15000 images from our 30 million images, due to lack of resources. Also, we add an image enhancement layer, time and space optimization, and Post-Correction layer to aid the model in predicting the correct word for the correct context. Notably, we propose an end-to-end text recognition approach using Vision Transformers as an encoder, namely BEIT, and vanilla Transformer as a decoder, eliminating CNNs for feature extraction and reducing the model's complexity. The experiments show that our end-to-end model outperforms Convolutions Backbones. The model attained a CER of 4.46%.
updated: Fri Aug 26 2022 21:02:07 GMT+0000 (UTC)
published: Sat Aug 20 2022 22:21:19 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト