arXiv reaDer
TPSNet:任意の形状のシーンテキスト検出のための薄板スプライン表現
TPSNet: Thin-Plate-Spline Representation for Arbitrary Shape Scene Text Detection
近年、シーンテキスト検出の研究の焦点は、テキスト表現が根本的な問題である任意の形状のテキストにシフトしています。理想的な表現は、コンパクトで、完全で、統合されており、私たちの意見で後で認識できるように再利用できる必要があります。ただし、以前の表現には1つまたはいくつかの側面があります。 Thin-Plate-Spline(TPS)変換は、シーンテキスト認識で大きな成功を収めています。これに触発されて、私たちはその使用法を逆に考え、TPSを任意の形状のテキスト検出のための絶妙な表現として洗練されたものと見なします。 TPS表現はコンパクトで、完全で、統合されており、予測されたTPSパラメータを使用して、検出されたテキスト領域をほぼ水平に修正できます。これは、その後の認識に役立ちます。キーポイント注釈なしのTPSトレーニングの監視問題を解決するために、境界セット損失と形状アライメント損失を含む2つの新しい損失が提案されています。いくつかの公開ベンチマークでの広範な評価とアブレーションは、提案された方法の有効性と優位性を示しています。
The research focus of scene text detection has shifted to arbitrary shape text in recent years, in which text representation is a fundamental problem. An ideal representation should be compact, complete, integral, and reusable for subsequent recognition in our opinion. However, previous representations suffer from one or several aspects. Thin-Plate-Spline (TPS) transformation has achieved great success in scene text recognition. Inspired from this, we reversely think its usage and sophisticatedly take TPS as an exquisite representation for arbitrary shape text detection. The TPS representation is compact, complete and integral, and with the predicted TPS parameters, the detected text region can be rectified to near-horizontal one which is beneficial for subsequent recognition. To solve the supervision problem of TPS training without key point annotations, two novel losses including the boundary set loss and the shape alignment loss are proposed. Extensive evaluation and ablation on several public benchmarks demonstrate the effectiveness and superiority of the proposed method.
updated: Mon Oct 25 2021 11:47:17 GMT+0000 (UTC)
published: Mon Oct 25 2021 11:47:17 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト