この論文では、テーブル構造認識のための新しいクラスの評価メトリックであるグリッドテーブル類似性(GriTS)を提案します。以前のメトリックとは異なり、GriTSは、予測されたテーブルの正確性を、マトリックスとしての自然な形で直接評価します。行列間の類似度を作成するために、NP困難である2次元最大共通下位構造(2D-LCS)問題を2D最も類似した下位構造(2D-MSS)問題に一般化し、多項式時間ヒューリスティックを提案します。それを解決します。 PubTables-1Mデータセットを使用して、マトリックス間の比較がテーブル構造認識評価の代替案よりも望ましい動作を示すことを経験的に検証します。 GriTSはまた、セルトポロジ認識、セル位置認識、セルコンテンツ認識の3つのサブタスクすべてを同じフレームワーク内に統合します。これにより、評価が簡素化され、さまざまなタイプの構造認識アプローチ間でより意味のある比較が可能になります。コードはhttps://github.com/microsoft/table-transformerでリリースされます。
In this paper, we propose a new class of evaluation metric for table structure recognition, grid table similarity (GriTS). Unlike prior metrics, GriTS evaluates the correctness of a predicted table directly in its natural form as a matrix. To create a similarity measure between matrices, we generalize the two-dimensional largest common substructure (2D-LCS) problem, which is NP-hard, to the 2D most similar substructures (2D-MSS) problem and propose a polynomial-time heuristic for solving it. We validate empirically using the PubTables-1M dataset that comparison between matrices exhibits more desirable behavior than alternatives for table structure recognition evaluation. GriTS also unifies all three subtasks of cell topology recognition, cell location recognition, and cell content recognition within the same framework, which simplifies the evaluation and enables more meaningful comparisons across different types of structure recognition approaches. Code will be released at https://github.com/microsoft/table-transformer.