arXiv reaDer
トレーニングプロトコルの問題:トレーニングプロトコル検索による正確なシーンテキスト認識に向けて
Training Protocol Matters: Towards Accurate Scene Text Recognition via Training Protocol Searching
ディープラーニングの時代におけるシーンテキスト認識(STR)の開発は、主にSTRモデルの新しいアーキテクチャに焦点が当てられてきました。ただし、トレーニングプロトコル(つまり、STRモデルのトレーニングに関連するハイパーパラメータの設定)は、優れたSTRモデルのトレーニングを成功させる上で同様に重要な役割を果たし、シーンテキスト認識については十分に検討されていません。この作業では、最適なトレーニングプロトコルを検索することにより、既存のSTRモデルの精度を向上させることを試みます。具体的には、新しく設計された検索空間に基づくトレーニングプロトコル検索アルゴリズムと、進化的最適化とプロキシタスクを使用した効率的な検索アルゴリズムを開発します。実験結果は、検索されたトレーニングプロトコルが主流のSTRモデルの認識精度を2.7%〜3.9%改善できることを示しています。特に、検索されたトレーニングプロトコルを使用すると、TRBA-Netは最先端のSTRモデル(つまりEFIFSTR)よりも2.1%高い精度を達成し、推論速度はCPUとGPUでそれぞれ2.3倍と3.7倍速くなります。 。提案された方法の有効性と我々の検索方法によって見つけられた訓練プロトコルの一般化能力を実証するために広範囲の実験が行われる。コードはhttps://github.com/VDIGPKU/STR_TPSearchで入手できます。
The development of scene text recognition (STR) in the era of deep learning has been mainly focused on novel architectures of STR models. However, training protocol (i.e., settings of the hyper-parameters involved in the training of STR models), which plays an equally important role in successfully training a good STR model, is under-explored for scene text recognition. In this work, we attempt to improve the accuracy of existing STR models by searching for optimal training protocol. Specifically, we develop a training protocol search algorithm, based on a newly designed search space and an efficient search algorithm using evolutionary optimization and proxy tasks. Experimental results show that our searched training protocol can improve the recognition accuracy of mainstream STR models by 2.7%~3.9%. In particular, with the searched training protocol, TRBA-Net achieves 2.1% higher accuracy than the state-of-the-art STR model (i.e., EFIFSTR), while the inference speed is 2.3x and 3.7x faster on CPU and GPU respectively. Extensive experiments are conducted to demonstrate the effectiveness of the proposed method and the generalization ability of the training protocol found by our search method. Code is available at https://github.com/VDIGPKU/STR_TPSearch.
updated: Thu Mar 17 2022 03:08:45 GMT+0000 (UTC)
published: Sun Mar 13 2022 16:11:58 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト