arXiv reaDer
TableFormer:トランスフォーマーによるテーブル構造の理解
TableFormer: Table Structure Understanding with Transformers
表は、貴重なコンテンツを簡潔でコンパクトな表現で整理します。このコンテンツは、検索エンジンやナレッジグラフなどのシステムにとって、予測機能を強化するため、非常に価値があります。残念ながら、テーブルにはさまざまな形やサイズがあります。さらに、複雑な列/行ヘッダー構成、複数行の行、さまざまな種類の分離線、エントリの欠落などが発生する可能性があります。そのため、画像からテーブル構造を正しく識別することは簡単な作業ではありません。この論文では、新しいテーブル構造識別モデルを提示します。後者は、最新のエンドツーエンドの深層学習モデル(つまり、PubTabNetのエンコーダー-デュアル-デコーダー)を2つの重要な方法で改善します。まず、テーブルセル用の新しいオブジェクト検出デコーダーを紹介します。このようにして、PDFソースから直接プログラムPDFからテーブルセルのコンテンツを取得し、カスタムOCRデコーダーのトレーニングを回避できます。このアーキテクチャの変更により、より正確なテーブルコンテンツの抽出が可能になり、英語以外のテーブルに取り組むことができます。次に、LSTMデコーダーをトランスベースのデコーダーに置き換えます。このアップグレードにより、以前の最先端のツリー編集距離スコア(TEDS)が、単純なテーブルでは91%から98.5%に、複雑なテーブルでは88.7%から95%に大幅に改善されます。
Tables organize valuable content in a concise and compact representation. This content is extremely valuable for systems such as search engines, Knowledge Graph's, etc, since they enhance their predictive capabilities. Unfortunately, tables come in a large variety of shapes and sizes. Furthermore, they can have complex column/row-header configurations, multiline rows, different variety of separation lines, missing entries, etc. As such, the correct identification of the table-structure from an image is a non-trivial task. In this paper, we present a new table-structure identification model. The latter improves the latest end-to-end deep learning model (i.e. encoder-dual-decoder from PubTabNet) in two significant ways. First, we introduce a new object detection decoder for table-cells. In this way, we can obtain the content of the table-cells from programmatic PDF's directly from the PDF source and avoid the training of the custom OCR decoders. This architectural change leads to more accurate table-content extraction and allows us to tackle non-english tables. Second, we replace the LSTM decoders with transformer based decoders. This upgrade improves significantly the previous state-of-the-art tree-editing-distance-score (TEDS) from 91% to 98.5% on simple tables and from 88.7% to 95% on complex tables.
updated: Fri Mar 11 2022 14:03:47 GMT+0000 (UTC)
published: Wed Mar 02 2022 10:46:24 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト