arXiv reaDer
TGRNet:テーブル構造認識のためのテーブルグラフ再構成ネットワーク
TGRNet: A Table Graph Reconstruction Network for Table Structure Recognition
データを行と列に配置するテーブルは非常に効果的なデータ構造であり、ビジネスや科学の研究で広く使用されています。オンラインおよびオフラインのドキュメント内の大規模な表形式のデータを考慮すると、自動テーブル認識はドキュメント分析コミュニティからますます注目を集めています。人間はテーブルの構造を簡単に理解できますが、特にテーブルのレイアウトやスタイルがさまざまであるため、マシンがそれを理解することは依然として課題です。既存の方法は通常、テーブルをマークアップシーケンスまたは異なるテーブルセル間の隣接行列としてモデル化し、テーブルセルの論理的な場所の重要性に対処できません。たとえば、セルはテーブルの最初の行と2番目の列にあります。 。本論文では、テーブル構造認識の問題をテーブルグラフ再構成として再定式化し、テーブル構造認識のためのエンドツーエンドのトレーニング可能なテーブルグラフ再構成ネットワーク(TGRNet)を提案した。具体的には、提案された方法は、異なるセルの空間的位置および論理的位置を共同で予測するために、セル検出ブランチおよびセル論理的位置ブランチの2つの主要なブランチを有する。 3つの一般的なテーブル認識データセットとテーブルグラフ注釈付きの新しいデータセット(TableGraph-350K)の実験結果は、テーブル構造認識のために提案されたTGRNetの有効性を示しています。コードと注釈は一般に公開されます。
A table arranging data in rows and columns is a very effective data structure, which has been widely used in business and scientific research. Considering large-scale tabular data in online and offline documents, automatic table recognition has attracted increasing attention from the document analysis community. Though human can easily understand the structure of tables, it remains a challenge for machines to understand that, especially due to a variety of different table layouts and styles. Existing methods usually model a table as either the markup sequence or the adjacency matrix between different table cells, failing to address the importance of the logical location of table cells, e.g., a cell is located in the first row and the second column of the table. In this paper, we reformulate the problem of table structure recognition as the table graph reconstruction, and propose an end-to-end trainable table graph reconstruction network (TGRNet) for table structure recognition. Specifically, the proposed method has two main branches, a cell detection branch and a cell logical location branch, to jointly predict the spatial location and the logical location of different cells. Experimental results on three popular table recognition datasets and a new dataset with table graph annotations (TableGraph-350K) demonstrate the effectiveness of the proposed TGRNet for table structure recognition. Code and annotations will be made publicly available.
updated: Sun Jun 20 2021 01:57:05 GMT+0000 (UTC)
published: Sun Jun 20 2021 01:57:05 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト