arXiv reaDer
LaTeX への科学的テーブル画像認識に関する ICDAR 2021 コンペティション
ICDAR 2021 Competition on Scientific Table Image Recognition to LaTeX
表には、多くの科学文書で重要な情報が簡潔に示されています。数学記号、方程式、スパンセルなどの視覚的特徴により、研究文書に埋め込まれた表から構造と内容を抽出することが難しくなります。このペーパーでは、LaTeX への科学的テーブル画像認識に関する ICDAR 2021 コンペティションのデータセット、タスク、参加者の方法、および結果について説明します。具体的には、コンテストのタスクは、表形式の画像を対応する LaTeX ソース コードに変換することです。私たちは 2 つのサブタスクを提案しました。サブタスク 1 では、参加者に画像から LaTeX 構造コードを再構築するように依頼します。サブタスク 2 では、参加者に画像から LaTeX コンテンツ コードを再構築するように依頼します。このレポートでは、データセットとグラウンド トゥルースの仕様について説明し、使用されたパフォーマンス評価指標の詳細を示し、最終結果を示し、参加する方法を要約します。チームによる提出 VCGroup は、サブタスク 1 で 74%、サブタスク 2 で 55% という最高の完全一致精度スコアを獲得し、以前のベースラインをそれぞれ 5% と 12% 上回った。モデルの認識機能にはまだ改善の余地がありますが、このコンペティションは、特定の制約の下で問題を解決するよう実践者に挑戦し、そのアプローチを共有することにより、完全に自動化されたテーブル認識システムの開発に貢献します。プラットフォームは、https://competitions.codalab.org/competitions/26979 でのチャレンジ後の提出に引き続き利用できます。
Tables present important information concisely in many scientific documents. Visual features like mathematical symbols, equations, and spanning cells make structure and content extraction from tables embedded in research documents difficult. This paper discusses the dataset, tasks, participants' methods, and results of the ICDAR 2021 Competition on Scientific Table Image Recognition to LaTeX. Specifically, the task of the competition is to convert a tabular image to its corresponding LaTeX source code. We proposed two subtasks. In Subtask 1, we ask the participants to reconstruct the LaTeX structure code from an image. In Subtask 2, we ask the participants to reconstruct the LaTeX content code from an image. This report describes the datasets and ground truth specification, details the performance evaluation metrics used, presents the final results, and summarizes the participating methods. Submission by team VCGroup got the highest Exact Match accuracy score of 74% for Subtask 1 and 55% for Subtask 2, beating previous baselines by 5% and 12%, respectively. Although improvements can still be made to the recognition capabilities of models, this competition contributes to the development of fully automated table recognition systems by challenging practitioners to solve problems under specific constraints and sharing their approaches; the platform will remain available for post-challenge submissions at https://competitions.codalab.org/competitions/26979 .
updated: Sun May 30 2021 04:17:55 GMT+0000 (UTC)
published: Sun May 30 2021 04:17:55 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト