arXiv reaDer
WeLayout: 企業文書における堅牢なレイアウト セグメンテーションに関する ICDAR 2023 コンペティション用の WeChat レイアウト分析システム
WeLayout: WeChat Layout Analysis System for the ICDAR 2023 Competition on Robust Layout Segmentation in Corporate Documents
このペーパーでは、WeChat Layout Analysis System の略で、企業ドキュメントのレイアウトをセグメント化するための新しいシステムである WeLayout を紹介します。私たちのアプローチは、堅牢なレイアウト セグメンテーションに関する ICDAR 2023 コンペティションのために特別に開発された、DINO モデルと YOLO モデルの洗練されたアンサンブルを利用しています。私たちの方法はベースラインを大幅に上回り、mAP 70.0 でリーダーボードのトップの位置を確保しました。このパフォーマンスを達成するために、私たちはデータセットの拡張、モデル アーキテクチャ、バウンディング ボックスの改良、モデル アンサンブル技術など、タスクのさまざまな側面を強化することに集中しました。さらに、より高い平均提出スコアを確保するために、ドキュメント カテゴリごとにデータを個別にトレーニングしました。また、パフォーマンスをさらに向上させるために、セル マッチングのアルゴリズムも開発しました。モデル アンサンブルの最適な重みと IoU しきい値を特定するために、ツリー構造パルゼン推定器と呼ばれるベイジアン最適化アルゴリズムを採用しました。私たちのアプローチは、企業ドキュメントで堅牢なレイアウトのセグメンテーションを実現するために、クエリベースのモデルとアンカーフリーのモデルを組み合わせる利点を効果的に示しています。
In this paper, we introduce WeLayout, a novel system for segmenting the layout of corporate documents, which stands for WeChat Layout Analysis System. Our approach utilizes a sophisticated ensemble of DINO and YOLO models, specifically developed for the ICDAR 2023 Competition on Robust Layout Segmentation. Our method significantly surpasses the baseline, securing a top position on the leaderboard with a mAP of 70.0. To achieve this performance, we concentrated on enhancing various aspects of the task, such as dataset augmentation, model architecture, bounding box refinement, and model ensemble techniques. Additionally, we trained the data separately for each document category to ensure a higher mean submission score. We also developed an algorithm for cell matching to further improve our performance. To identify the optimal weights and IoU thresholds for our model ensemble, we employed a Bayesian optimization algorithm called the Tree-Structured Parzen Estimator. Our approach effectively demonstrates the benefits of combining query-based and anchor-free models for achieving robust layout segmentation in corporate documents.
updated: Thu May 11 2023 04:05:30 GMT+0000 (UTC)
published: Thu May 11 2023 04:05:30 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト