arXiv reaDer
表構造認識手法の再現性と再現性に関する研究
A Study on Reproducibility and Replicability of Table Structure Recognition Methods
人工知能 (AI) の再現性に関する懸念が浮上しており、研究者は、この分野で公開された調査結果を直接再現しようとして失敗したと報告しています。再現性、つまり新しいデータに対して同じ手順を使用して調査結果を確認する能力は、十分に研究されていません。この論文では、テーブル構造認識 (TSR) に関する 16 の論文のコーパスの再現性と複製性の両方を調べます。これは、デジタル ドキュメント内のテーブルのセル位置を特定することを目的とした AI タスクです。元の著者によって提供されたコードとデータセットを使用して、公開された結果を再現しようとします。次に、元のデータセットと同様のデータセットと、科学論文から抽出された 386 の注釈付きテーブルで構成される新しいデータセット GenTSR を使用して、複製可能性を調べます。調査した 16 の論文のうち、オリジナルと一致する結果を再現した論文は 4 つだけです。 4 つの論文のうち 2 つは、特定の IoU 値の下で同様のデータセットを使用して複製可能であると識別されます。新しいデータセットを使用して複製可能であると特定された論文はありません。非再現性と非再現性の原因について考察します。すべてのコードとデータは、https://codeocean.com/capsule/6680116/tree の Codeocean で入手できます。
Concerns about reproducibility in artificial intelligence (AI) have emerged, as researchers have reported unsuccessful attempts to directly reproduce published findings in the field. Replicability, the ability to affirm a finding using the same procedures on new data, has not been well studied. In this paper, we examine both reproducibility and replicability of a corpus of 16 papers on table structure recognition (TSR), an AI task aimed at identifying cell locations of tables in digital documents. We attempt to reproduce published results using codes and datasets provided by the original authors. We then examine replicability using a dataset similar to the original as well as a new dataset, GenTSR, consisting of 386 annotated tables extracted from scientific papers. Out of 16 papers studied, we reproduce results consistent with the original in only four. Two of the four papers are identified as replicable using the similar dataset under certain IoU values. No paper is identified as replicable using the new dataset. We offer observations on the causes of irreproducibility and irreplicability. All code and data are available on Codeocean at https://codeocean.com/capsule/6680116/tree.
updated: Thu Apr 20 2023 16:30:58 GMT+0000 (UTC)
published: Thu Apr 20 2023 16:30:58 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト