arXiv reaDer
ARTS:自動修正テキストスポッターを使用したテキストの検出と認識の間の不整合の排除
ARTS: Eliminating Inconsistency between Text Detection and Recognition with Auto-Rectification Text Spotter
エンドツーエンドのテキストスポッティングのための最近のアプローチは、有望な結果を達成しています。ただし、現在のスポッターのほとんどは、テキストの検出と認識の間の不整合の問題に悩まされていました。この作業では、不整合問題の存在を紹介および証明し、(1)トレーニングとテストの間のテキスト認識機能の不整合、および(2)テキスト検出と認識の間の最適化ターゲットの不整合の2つの側面から分析します。前述の問題を解決するために、微分可能な自動修正モジュール(ARM)と新しいトレーニング戦略を提案して、認識損失を検出ブランチに伝播できるようにします。これにより、検出ブランチは、主に検出ターゲットと認識ターゲットによって共同で最適化できます。テキストの検出と認識の間の不整合の問題を軽減します。これらの設計に基づいて、自動修正テキストスポッター(ARTS)と呼ばれる、シンプルでありながら堅牢なエンドツーエンドのテキストスポッティングフレームワークを提示し、自然のシーンで任意の形状のテキストを検出および認識します。広範な実験は、私たちの方法の優位性を示しています。特に、ARTS-Sは、10.5 FPSの競争速度で、Total-Textで77.1%のエンドツーエンドのテキストスポッティングFメジャーを達成します。これは、精度と推論速度の両方で以前の方法を大幅に上回っています。
Recent approaches for end-to-end text spotting have achieved promising results. However, most of the current spotters were plagued by the inconsistency problem between text detection and recognition. In this work, we introduce and prove the existence of the inconsistency problem and analyze it from two aspects: (1) inconsistency of text recognition features between training and testing, and (2) inconsistency of optimization targets between text detection and recognition. To solve the aforementioned issues, we propose a differentiable Auto-Rectification Module (ARM) together with a new training strategy to enable propagating recognition loss back into detection branch, so that our detection branch can be jointly optimized by detection and recognition targets, which largely alleviates the inconsistency problem between text detection and recognition. Based on these designs, we present a simple yet robust end-to-end text spotting framework, termed Auto-Rectification Text Spotter (ARTS), to detect and recognize arbitrarily-shaped text in natural scenes. Extensive experiments demonstrate the superiority of our method. In particular, our ARTS-S achieves 77.1% end-to-end text spotting F-measure on Total-Text at a competitive speed of 10.5 FPS, which significantly outperforms previous methods in both accuracy and inference speed.
updated: Wed Oct 20 2021 06:53:44 GMT+0000 (UTC)
published: Wed Oct 20 2021 06:53:44 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト