arXiv reaDer
チャート分類に関する調査とアプローチ
A Survey and Approach to Chart Classification
チャートは文書内の視覚情報の重要な情報源を表し、通常は数値で伝えられる情報の深い理解と解釈を容易にします。科学文献には、スタイルの違いを持つ多くのグラフがあります。最近、文書理解コミュニティは、チャートの分類から始まる自動チャート理解の問題に取り組み始めました。このペーパーでは、グラフ分類のための現在の最先端技術の概要を紹介し、利用可能なデータセットとそれらでサポートされているグラフの種類について説明します。私たちはこれらの貢献を、ML、CNN、Transformers に基づく従来のアプローチとして大まかに分類します。さらに、ICPR 2022 の CHART インフォグラフィックス コンペティション用に最近公開された CHARTINFO UB-UNITECH PMC データセットに対して、CNN ベースのアプローチとトランスフォーマー ベースのアプローチの広範な比較パフォーマンス分析を実行します。このデータセットには、22,923 を含む 15 の異なるチャート カテゴリが含まれています。トレーニング画像と 13,260 のテスト画像。私たちは、チャート分類において最先端の結果を生み出すビジョンベースのトランスフォーマー モデルを実装しました。
Charts represent an essential source of visual information in documents and facilitate a deep understanding and interpretation of information typically conveyed numerically. In the scientific literature, there are many charts, each with its stylistic differences. Recently the document understanding community has begun to address the problem of automatic chart understanding, which begins with chart classification. In this paper, we present a survey of the current state-of-the-art techniques for chart classification and discuss the available datasets and their supported chart types. We broadly classify these contributions as traditional approaches based on ML, CNN, and Transformers. Furthermore, we carry out an extensive comparative performance analysis of CNN-based and transformer-based approaches on the recently published CHARTINFO UB-UNITECH PMC dataset for the CHART-Infographics competition at ICPR 2022. The data set includes 15 different chart categories, including 22,923 training images and 13,260 test images. We have implemented a vision-based transformer model that produces state-of-the-art results in chart classification.
updated: Sun Jul 09 2023 10:35:19 GMT+0000 (UTC)
published: Sun Jul 09 2023 10:35:19 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト