arXiv reaDer
カウントがHMERに出会うとき:手書きの数式認識のためのカウント対応ネットワーク
When Counting Meets HMER: Counting-Aware Network for Handwritten Mathematical Expression Recognition
最近、ほとんどの手書きの数式認識(HMER)メソッドは、注意メカニズムを使用して数式画像からマークアップシーケンスを直接予測するエンコーダーデコーダーネットワークを採用しています。ただし、このような方法では、複雑な構造の数式を正確に読み取ったり、長いマークアップシーケンスを生成したりできない場合があります。これは、文体や空間レイアウトが大きく異なるため、注意の結果が不正確になることが多いためです。この問題を軽減するために、HMERとシンボルカウントの2つのタスクを共同で最適化するCounting-Aware Network(CAN)という名前のHMER用の型破りなネットワークを提案します。具体的には、シンボルレベルの位置注釈なしで各シンボルクラスの数を予測できる弱く監視されたカウントモジュールを設計し、それをHMERの一般的な注意ベースのエンコーダーデコーダーモデルにプラグインします。 HMERのベンチマークデータセットでの実験は、ジョイントの最適化とカウント結果の両方がエンコーダー-デコーダーモデルの予測エラーを修正するのに有益であり、CANが常に最先端の方法を上回っていることを検証します。特に、HMERのエンコーダー-デコーダーモデルと比較して、提案されたカウントモジュールによって引き起こされる余分な時間コストはわずかです。ソースコードはhttps://github.com/LBH1024/CANで入手できます。
Recently, most handwritten mathematical expression recognition (HMER) methods adopt the encoder-decoder networks, which directly predict the markup sequences from formula images with the attention mechanism. However, such methods may fail to accurately read formulas with complicated structure or generate long markup sequences, as the attention results are often inaccurate due to the large variance of writing styles or spatial layouts. To alleviate this problem, we propose an unconventional network for HMER named Counting-Aware Network (CAN), which jointly optimizes two tasks: HMER and symbol counting. Specifically, we design a weakly-supervised counting module that can predict the number of each symbol class without the symbol-level position annotations, and then plug it into a typical attention-based encoder-decoder model for HMER. Experiments on the benchmark datasets for HMER validate that both joint optimization and counting results are beneficial for correcting the prediction errors of encoder-decoder models, and CAN consistently outperforms the state-of-the-art methods. In particular, compared with an encoder-decoder model for HMER, the extra time cost caused by the proposed counting module is marginal. The source code is available at https://github.com/LBH1024/CAN.
updated: Sat Jul 23 2022 08:39:32 GMT+0000 (UTC)
published: Sat Jul 23 2022 08:39:32 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト