arXiv reaDer
トランスフォーマーを使用した任意の形状のテキスト検出
Arbitrary Shape Text Detection using Transformers
最近のテキスト検出フレームワークでは、任意の形状のテキスト画像を検出するために、アンカー生成、非最大抑制(NMS)、または複数の処理段階(ラベル生成など)などのいくつかの手作りコンポーネントが必要です。対照的に、トランスフォーマーを使用した検出(DETR)に基づくエンドツーエンドのトレーニング可能なアーキテクチャを提案します。これは、任意の形状のテキスト検出における以前の最先端の方法よりも優れています。基本的に、提案された方法は、任意の検出されたテキスト領域のスケールとアスペクト比の変化を正確に測定するバウンディングボックス損失関数を利用します。これは、区分的ポリゴンにさらに分割されたベジェ曲線から作成されたハイブリッド形状表現によって可能になります。提案された損失関数は、区分的ポリゴンで定義され、ベジェ曲線の制御点でのSmooth-ln回帰によって正則化された、一般化された分割交差オーバーユニオン損失の組み合わせです。湾曲したテキストにはTotal-TextおよびCTW-1500データセットを使用し、多方向テキストにはMSRA-TD500およびICDAR15データセットを使用して提案モデルを評価し、提案された方法が以前の最先端の方法よりも任意の方法で優れていることを示します。 -形状テキスト検出タスク。
Recent text detection frameworks require several handcrafted components such as anchor generation, non-maximum suppression (NMS), or multiple processing stages (e.g. label generation) to detect arbitrarily shaped text images. In contrast, we propose an end-to-end trainable architecture based on Detection using Transformers (DETR), that outperforms previous state-of-the-art methods in arbitrary-shaped text detection. At its core, our proposed method leverages a bounding box loss function that accurately measures the arbitrary detected text regions' changes in scale and aspect ratio. This is possible due to a hybrid shape representation made from Bezier curves, that are further split into piece-wise polygons. The proposed loss function is then a combination of a generalized-split-intersection-over-union loss defined over the piece-wise polygons and regularized by a Smooth-ln regression over the Bezier curve's control points. We evaluate our proposed model using Total-Text and CTW-1500 datasets for curved text, and MSRA-TD500 and ICDAR15 datasets for multi-oriented text, and show that the proposed method outperforms the previous state-of-the-art methods in arbitrary-shape text detection tasks.
updated: Tue Feb 22 2022 22:36:29 GMT+0000 (UTC)
published: Tue Feb 22 2022 22:36:29 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト