arXiv reaDer
レキシコンと深さ方向に分離可能な畳み込みベースの手書きテキスト認識システム
A Lexicon and Depth-wise Separable Convolution Based Handwritten Text Recognition System
筆記体の手書きテキスト認識は、パターン認識の分野での挑戦的な研究問題です。現在の最先端のアプローチには、畳み込みリカレントニューラルネットワークと多次元の長短期記憶リカレントニューラルネットワーク技術に基づくモデルが含まれています。これらの方法は計算量が非常に多く、モデルは設計レベルで複雑です。最近の研究では、畳み込みニューラルネットワークとゲート付き畳み込みニューラルネットワークベースのモデルの組み合わせは、畳み込みリカレントニューラルネットワークベースのモデルと比較して、パラメーターの数が少ないことを示しました。トレーニングするパラメーターの総数を減らす方向で、この作業では、ゲート付き畳み込みニューラルネットワークと双方向ゲート付き回帰ユニットを組み合わせた標準畳み込みの代わりに深さ方向の畳み込みを使用して、パラメーターの総数を減らしました。訓練される。さらに、テストステップでレキシコンベースのワードビームサーチデコーダーも含まれています。また、モデルの全体的な精度を向上させるのにも役立ちます。 IAMデータセットで3.84%の文字エラー率と9.40%の単語エラー率を取得しました。ジョージワシントンのデータセットでは、それぞれ4.88%の文字エラー率と14.56%の単語エラー率です。
Cursive handwritten text recognition is a challenging research problem in the domain of pattern recognition. The current state-of-the-art approaches include models based on convolutional recurrent neural networks and multi-dimensional long short-term memory recurrent neural networks techniques. These methods are highly computationally extensive as well model is complex at design level. In recent studies, combination of convolutional neural network and gated convolutional neural networks based models demonstrated less number of parameters in comparison to convolutional recurrent neural networks based models. In the direction to reduced the total number of parameters to be trained, in this work, we have used depthwise convolution in place of standard convolutions with a combination of gated-convolutional neural network and bidirectional gated recurrent unit to reduce the total number of parameters to be trained. Additionally, we have also included a lexicon based word beam search decoder at testing step. It also helps in improving the the overall accuracy of the model. We have obtained 3.84% character error rate and 9.40% word error rate on IAM dataset; 4.88% character error rate and 14.56% word error rate in George Washington dataset, respectively.
updated: Mon Jul 11 2022 06:24:26 GMT+0000 (UTC)
published: Mon Jul 11 2022 06:24:26 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト