arXiv reaDer
拡張現実のためのシーンテキスト検出-偽陽性率を減らすための文字バイグラムアプローチ
Scene Text Detection for Augmented Reality -- Character Bigram Approach to reduce False Positive Rate
自然なシーンテキストの検出は、シーン理解の重要な側面であり、魅力的な拡張現実アプリケーションを構築するのに役立つツールになる可能性があります。この作業では、テキストスポッティングにおける誤検知の問題に対処します。単一文字ではなく文字ペア(バイグラム)を探すことにより、スライディングウィンドウテキストスポッターのパフォーマンスを向上させることを提案します。効率的な畳み込みニューラルネットワークは、バイグラムを検出するように設計およびトレーニングされています。提案された検出器は、ICDAR 2015データセットの偽陽性率を28.16%削減します。バイグラムの検出は、スライディングウィンドウテキストスポッターを改善するための計算コストの低い方法であることを示します。
Natural scene text detection is an important aspect of scene understanding and could be a useful tool in building engaging augmented reality applications. In this work, we address the problem of false positives in text spotting. We propose improving the performace of sliding window text spotters by looking for character pairs (bigrams) rather than single characters. An efficient convolutional neural network is designed and trained to detect bigrams. The proposed detector reduces false positive rate by 28.16% on the ICDAR 2015 dataset. We demonstrate that detecting bigrams is a computationally inexpensive way to improve sliding window text spotters.
updated: Sat Dec 26 2020 08:56:10 GMT+0000 (UTC)
published: Sat Dec 26 2020 08:56:10 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト