arXiv reaDer
グローバルレベルおよび単語レベルの機能に基づくリアルタイムのシーンテキスト検出
Real-time Scene Text Detection Based on Global Level and Word Level Features
自然なシーンで任意の形状のテキストを高精度かつ効率的に検出することは非常に困難な作業です。本論文では、シーンテキスト検出フレームワーク、すなわちGWNetを提案する。これは主にグローバルモジュールとRCNNモジュールの2つのモジュールを含む。具体的には、グローバルモジュールは、kサブモジュールとシフトサブモジュールを追加することにより、DB(微分可能二値化)モジュールの適応パフォーマンスを向上させます。 2つのサブモジュールは、増幅率kの適応性を高め、モデルの収束を加速し、より正確な検出結果を生成するのに役立ちます。 RCNNモジュールは、グローバルレベルとワードレベルの機能を融合します。単語レベルのラベルは、縮小されたポリゴンの軸に沿った最小の長方形ボックスを取得することによって生成されます。推論期間中、GWNetはグローバルレベルの機能のみを使用して単純なポリゴン検出を出力します。 MSRA-TD500、Total-Text、ICDAR2015、CTW-1500を含む4つのベンチマークデータセットでの実験は、GWNetが最先端の検出器よりも優れていることを示しています。具体的には、ResNet-50のバックボーンを使用して、MSRA- TD500で88.6%、Total-Textで87.9%、ICDAR2015で89.2%、CTW-1500で87.5%のF値を達成します。
It is an extremely challenging task to detect arbitrary shape text in natural scenes on high accuracy and efficiency. In this paper, we propose a scene text detection framework, namely GWNet, which mainly includes two modules: Global module and RCNN module. Specifically, Global module improves the adaptive performance of the DB (Differentiable Binarization) module by adding k submodule and shift submodule. Two submodules enhance the adaptability of amplifying factor k, accelerate the convergence of models and help to produce more accurate detection results. RCNN module fuses global-level and word-level features. The word-level label is generated by obtaining the minimum axis-aligned rectangle boxes of the shrunk polygon. In the inference period, GWNet only uses global-level features to output simple polygon detections. Experiments on four benchmark datasets, including the MSRA-TD500, Total-Text, ICDAR2015 and CTW-1500, demonstrate that our GWNet outperforms the state-of-the-art detectors. Specifically, with a backbone of ResNet-50, we achieve an F-measure of 88.6% on MSRA- TD500, 87.9% on Total-Text, 89.2% on ICDAR2015 and 87.5% on CTW-1500.
updated: Thu Mar 10 2022 09:28:15 GMT+0000 (UTC)
published: Thu Mar 10 2022 09:28:15 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト