この論文では、グリッドテーブル類似性(GriTS)と呼ばれるテーブル構造認識(TSR)評価のための新しいクラスのメトリックを提案します。以前のメトリックとは異なり、GriTSは、予測されたテーブルの正確性を、マトリックスとしての自然な形で直接評価します。行列間の類似度を作成するために、NP困難である2次元最大共通部分構造(2D-LCS)問題を2D最も類似した部分構造(2D-MSS)問題に一般化し、多項式時間ヒューリスティックを提案します。それを解決します。このアルゴリズムは、行列間の真の類似性の上限と下限の両方を生成します。大規模な実世界のデータセットでの評価を使用して、実際にはこれらの境界の間にほとんど違いがないことを示します。 GriTSを他のメトリックと比較し、マトリックスの類似性がTSRパフォーマンス評価の代替手段よりも望ましい動作を示すことを経験的に検証します。最後に、GriTSは、セルトポロジ認識、セル位置認識、およびセルコンテンツ認識の3つのサブタスクすべてを同じフレームワーク内に統合します。これにより、評価が簡素化され、さまざまなタイプのTSRアプローチ間でより意味のある比較が可能になります。コードはhttps://github.com/microsoft/table-transformerでリリースされます。
In this paper, we propose a new class of metric for table structure recognition (TSR) evaluation, called grid table similarity (GriTS). Unlike prior metrics, GriTS evaluates the correctness of a predicted table directly in its natural form as a matrix. To create a similarity measure between matrices, we generalize the two-dimensional largest common substructure (2D-LCS) problem, which is NP-hard, to the 2D most similar substructures (2D-MSS) problem and propose a polynomial-time heuristic for solving it. This algorithm produces both an upper and a lower bound on the true similarity between matrices. We show using evaluation on a large real-world dataset that in practice there is almost no difference between these bounds. We compare GriTS to other metrics and empirically validate that matrix similarity exhibits more desirable behavior than alternatives for TSR performance evaluation. Finally, GriTS unifies all three subtasks of cell topology recognition, cell location recognition, and cell content recognition within the same framework, which simplifies the evaluation and enables more meaningful comparisons across different types of TSR approaches. Code will be released at https://github.com/microsoft/table-transformer.