arXiv reaDer
不規則なシーンのテキスト認識の再考
Rethinking Irregular Scene Text Recognition
 テキストのフォント、色、サイズ、複雑な背景などが非常に多様であるため、自然画像からテキストを読み取ることは困難です。文字の遠近法による歪みと非線形の空間配置により、さらに困難になります。修正ベースの方法は直感的に根拠があり、エンベロープを圧倒的に押し上げましたが、その可能性は十分に活用されていません。このホワイトペーパーでは、整流ベースの方法のパフォーマンスを大幅に向上させることがわかっているトリックを紹介します。曲線テキストデータセットでは、このメソッドはCUTE-80で89.6%、Total-Textで76.3%の精度を達成し、それぞれ従来の最新技術より6.3%および14.7%向上しています。さらに、私たちのトリックの組み合わせは、ICDAR 2019 Arbitrary-Shaped Text Challenge(Latin script)に勝ち、ホールドアウトテストセットで74.3%の精度を達成するのに役立ちます。 https://github.com/Jyouhou/ICDAR2019-ArT-Recognition-Alchemyでさらに調査するために、コードとデータサンプルをリリースします
Reading text from natural images is challenging due to the great variety in text font, color, size, complex background and etc.. The perspective distortion and non-linear spatial arrangement of characters make it further difficult. While rectification based method is intuitively grounded and has pushed the envelope by far, its potential is far from being well exploited. In this paper, we present a bag of tricks that prove to significantly improve the performance of rectification based method. On curved text dataset, our method achieves an accuracy of 89.6% on CUTE-80 and 76.3% on Total-Text, an improvement over previous state-of-the-art by 6.3% and 14.7% respectively. Furthermore, our combination of tricks helps us win the ICDAR 2019 Arbitrary-Shaped Text Challenge (Latin script), achieving an accuracy of 74.3% on the held-out test set. We release our code as well as data samples for further exploration at https://github.com/Jyouhou/ICDAR2019-ArT-Recognition-Alchemy
updated: Mon Nov 11 2019 17:25:43 GMT+0000 (UTC)
published: Fri Aug 30 2019 16:47:08 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト