arXiv reaDer
手書きの数式認識のための構文認識ネットワーク
Syntax-Aware Network for Handwritten Mathematical Expression Recognition
手書きの数式認識(HMER)は、多くの潜在的なアプリケーションがある挑戦的なタスクです。 HMERの最近の方法は、エンコーダ-デコーダアーキテクチャで卓越したパフォーマンスを実現しています。ただし、これらの方法は、予測が「ある文字から別の文字へ」行われるというパラダイムに準拠しており、数式の複雑な構造やカニのある手書きのために、必然的に予測エラーが発生します。本論文では、エンコーダ-デコーダネットワークに構文情報を組み込んだ最初のHMERの簡単で効率的な方法を提案します。具体的には、各式のLaTeXマークアップシーケンスを解析ツリーに変換するための一連の文法規則を示します。次に、マークアップシーケンス予測を、深いニューラルネットワークを使用したツリートラバースプロセスとしてモデル化します。このようにして、提案された方法は、式の構文コンテキストを効果的に記述し、HMERの構造予測エラーを軽減することができます。 3つのベンチマークデータセットでの実験は、私たちの方法が従来技術よりも優れた認識性能を達成することを示しています。私たちの方法の有効性をさらに検証するために、1万人の作家から取得した10万の手書きの数式画像で構成される大規模なデータセットを作成します。この作業のソースコード、新しいデータセット、および事前にトレーニングされたモデルが公開されます。
Handwritten mathematical expression recognition (HMER) is a challenging task that has many potential applications. Recent methods for HMER have achieved outstanding performance with an encoder-decoder architecture. However, these methods adhere to the paradigm that the prediction is made "from one character to another", which inevitably yields prediction errors due to the complicated structures of mathematical expressions or crabbed handwritings. In this paper, we propose a simple and efficient method for HMER, which is the first to incorporate syntax information into an encoder-decoder network. Specifically, we present a set of grammar rules for converting the LaTeX markup sequence of each expression into a parsing tree; then, we model the markup sequence prediction as a tree traverse process with a deep neural network. In this way, the proposed method can effectively describe the syntax context of expressions, alleviating the structure prediction errors of HMER. Experiments on three benchmark datasets demonstrate that our method achieves better recognition performance than prior arts. To further validate the effectiveness of our method, we create a large-scale dataset consisting of 100k handwritten mathematical expression images acquired from ten thousand writers. The source code, new dataset, and pre-trained models of this work will be publicly available.
updated: Mon Mar 28 2022 07:23:52 GMT+0000 (UTC)
published: Thu Mar 03 2022 09:57:19 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト