arXiv reaDer
畳み込みにより、制約のない手書きテキスト認識の再発はすでに廃止されていますか?
Have convolutions already made recurrence obsolete for unconstrained handwritten text recognition ?
制約のない手書きテキスト認識は、ディープニューラルネットワークにとって依然として重要な課題です。ここ数年、リカレントネットワーク、より具体的には長短期記憶ネットワークは、この分野で最先端のパフォーマンスを達成しています。それにもかかわらず、それらは多数のトレーニング可能なパラメーターで構成されており、リカレントニューラルネットワークのトレーニングは並列処理をサポートしていません。これは、そのようなアーキテクチャのトレーニング時間に直接影響し、さまざまなアーキテクチャの探索に必要な時間にも直接影響します。最近、ゲートメカニズムを備えた完全畳み込みネットワークなどの無再発アーキテクチャが、競争力のある結果を達成するための1つの可能な代替案として提案されています。このホワイトペーパーでは、畳み込みアーキテクチャを調査し、それらをCNN + BLSTMベースラインと比較します。 RIMESデータセットを使用したオフライン手書き認識タスクのさまざまなアーキテクチャに関する実験的研究と、印刷されたグリッドであるノートブックの背景で画像を拡張することで構成される修正バージョンを提案します。
Unconstrained handwritten text recognition remains an important challenge for deep neural networks. These last years, recurrent networks and more specifically Long Short-Term Memory networks have achieved state-of-the-art performance in this field. Nevertheless, they are made of a large number of trainable parameters and training recurrent neural networks does not support parallelism. This has a direct influence on the training time of such architectures, with also a direct consequence on the time required to explore various architectures. Recently, recurrence-free architectures such as Fully Convolutional Networks with gated mechanisms have been proposed as one possible alternative achieving competitive results. In this paper, we explore convolutional architectures and compare them to a CNN+BLSTM baseline. We propose an experimental study regarding different architectures on an offline handwriting recognition task using the RIMES dataset, and a modified version of it that consists of augmenting the images with notebook backgrounds that are printed grids.
updated: Wed Dec 09 2020 10:15:24 GMT+0000 (UTC)
published: Wed Dec 09 2020 10:15:24 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト