arXiv reaDer
Stroke extraction for offline handwritten mathematical expression recognition
 オフラインの手書きの数式認識は、一時的な情報がないため、オンラインの数式よりもはるかに難しいと考えられることがよくあります。オンライン認識のためのより成熟した方法を活用し、リソースを節約するために、テキストのビットマップ画像からストロークを自動的に回復するオーバーセグメンテーションアプローチが提案されています。提案されたアルゴリズムは、最初に2値化画像のスケルトンをジャンクションとセグメントに分解し、次にセグメントをマージしてストロークを形成し、最後に再帰投影とトポロジカルソートを使用してストローク順序を正規化します。抽出されたストローク用に特別に設計されていない通常のオンライン認識機能と組み合わせて、良好なオフライン精度が得られました。既製の最新のオンライン手書き数式認識エンジンを使用すると、提案された手順は、オンライン手書き数式の認識に関するコンテストのデータセットからレンダリングされたオフライン数式の58.22%、65.65%、および65.22%を正しく認識しました。 (クローム)、それぞれ2014年、2016年、2019年。さらに、トレーニング可能なオンライン認識システムがあれば、抽出されたストロークで再トレーニングすると、同じレベルの精度のオフライン認識システムができました。一方、パイプライン全体の速度は、リソースが限られている携帯電話でのデバイス上の認識を容易にするのに十分な速さでした。結論として、ストローク抽出は、光学式文字認識ソフトウェアを構築する魅力的な方法を提供します。
Offline handwritten mathematical expression recognition is often considered much harder than its online counterpart due to the absence of temporal information. In order to take advantage of the more mature methods for online recognition and save resources, an oversegmentation approach is proposed to recover strokes from textual bitmap images automatically. The proposed algorithm first breaks down the skeleton of a binarized image into junctions and segments, then segments are merged to form strokes, finally stroke order is normalized by using recursive projection and topological sort. Good offline accuracy was obtained in combination with ordinary online recognizers, which are not specially designed for extracted strokes. Given a ready-made state-of-the-art online handwritten mathematical expression recognizer, the proposed procedure correctly recognized 58.22%, 65.65%, and 65.22% of the offline formulas rendered from the datasets of the Competitions on Recognition of Online Handwritten Mathematical Expressions(CROHME) in 2014, 2016, and 2019 respectively. Furthermore, given a trainable online recognition system, retraining it with extracted strokes resulted in an offline recognizer with the same level of accuracy. On the other hand, the speed of the entire pipeline was fast enough to facilitate on-device recognition on mobile phones with limited resources. To conclude, stroke extraction provides an attractive way to build optical character recognition software.
updated: Thu Jan 16 2020 14:08:58 GMT+0000 (UTC)
published: Thu May 16 2019 13:40:43 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)アソシエイト