最近、セグメンテーション ベースの方法は、主にテキスト カーネルのセグメンテーションと拡張の 2 つのステップを含むシーン テキスト検出で非常に人気があります。ただし、セグメンテーション プロセスでは、各ピクセルを個別に考慮するだけであり、拡張プロセスでは、精度と速度の良好なトレードオフを達成することは困難です。この論文では、これらの問題に取り組むために、Context-aware and Boundary-guided Network (CBN) を提案します。 CBN では、最初に基本的なテキスト検出器を使用して、最初のセグメンテーション結果を予測します。次に、グローバル コンテキストとローカル コンテキストの両方を考慮する、テキスト カーネル機能の表現を強化するためのコンテキスト認識モジュールを提案します。最後に、正確なテキスト境界を取得するだけでなく、特に高解像度の出力マップで高速を維持する、輪郭上のピクセルのみを使用して拡張テキスト カーネルを適応的に拡張するための境界ガイド モジュールを導入します。特に、軽量のバックボーンを使用して、提案された CBN を搭載した基本的な検出器は、いくつかの一般的なベンチマークで最先端の結果を達成し、提案された CBN はいくつかのセグメンテーションベースの方法にプラグインできます。コードは https://github.com/XiiZhao/cbn.pytorch で入手できます。
Recently, segmentation-based methods are quite popular in scene text detection, which mainly contain two steps: text kernel segmentation and expansion. However, the segmentation process only considers each pixel independently, and the expansion process is difficult to achieve a favorable accuracy-speed trade-off. In this paper, we propose a Context-aware and Boundary-guided Network (CBN) to tackle these problems. In CBN, a basic text detector is firstly used to predict initial segmentation results. Then, we propose a context-aware module to enhance text kernel feature representations, which considers both global and local contexts. Finally, we introduce a boundary-guided module to expand enhanced text kernels adaptively with only the pixels on the contours, which not only obtains accurate text boundaries but also keeps high speed, especially on high-resolution output maps. In particular, with a lightweight backbone, the basic detector equipped with our proposed CBN achieves state-of-the-art results on several popular benchmarks, and our proposed CBN can be plugged into several segmentation-based methods. Code will be available on https://github.com/XiiZhao/cbn.pytorch.