arXiv reaDer
シーンテキスト認識のためのデータ拡張
Data Augmentation for Scene Text Recognition
シーンテキスト認識(STR)は、自然のシーンに多数のテキストが表示される可能性があるため、コンピュータービジョンでは困難な作業です。ほとんどのSTRモデルは、十分に大きくて公開されているラベル付きの実際のデータセットがないため、トレーニングに合成データセットに依存しています。 STRモデルは実際のデータを使用して評価されるため、トレーニングとテストのデータ分布の不一致により、特にノイズ、アーティファクト、ジオメトリ、構造などの影響を受ける難しいテキストでモデルのパフォーマンスが低下します。このペーパーでは、STRAugを紹介します。 STR用に設計された36個の画像増強機能で構成されています。各関数は、自然のシーンで見られる、カメラセンサーによって引き起こされる、または信号処理操作によって引き起こされるが、トレーニングデータセットでは十分に表現されていない特定のテキスト画像プロパティを模倣します。 RandAugmentを使用して強力なベースラインモデルに適用すると、STRAugは、定期的および不定期のテストデータセット全体でSTRモデルの全体的な絶対精度を、Rosettaで2.10%、R2AMで1.48%、CRNNで1.30%、RAREで1.35%、1.06まで大幅に向上させます。 TRBAで%、GCRNNで0.89%。 STRAug関数によって提供されるAPIの多様性と単純さにより、STRの既存のデータ拡張メソッドの複製と検証が容易になります。 STRAugはhttps://github.com/roatienza/straugで入手できます。
Scene text recognition (STR) is a challenging task in computer vision due to the large number of possible text appearances in natural scenes. Most STR models rely on synthetic datasets for training since there are no sufficiently big and publicly available labelled real datasets. Since STR models are evaluated using real data, the mismatch between training and testing data distributions results into poor performance of models especially on challenging text that are affected by noise, artifacts, geometry, structure, etc. In this paper, we introduce STRAug which is made of 36 image augmentation functions designed for STR. Each function mimics certain text image properties that can be found in natural scenes, caused by camera sensors, or induced by signal processing operations but poorly represented in the training dataset. When applied to strong baseline models using RandAugment, STRAug significantly increases the overall absolute accuracy of STR models across regular and irregular test datasets by as much as 2.10% on Rosetta, 1.48% on R2AM, 1.30% on CRNN, 1.35% on RARE, 1.06% on TRBA and 0.89% on GCRNN. The diversity and simplicity of API provided by STRAug functions enable easy replication and validation of existing data augmentation methods for STR. STRAug is available at https://github.com/roatienza/straug.
updated: Mon Aug 16 2021 07:53:30 GMT+0000 (UTC)
published: Mon Aug 16 2021 07:53:30 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト