arXiv reaDer
分類-チャート理解のための回帰
Classification-Regression for Chart Comprehension
グラフは、データの視覚化の一般的で効果的な形式です。チャートの質問応答(CQA)は、チャートの理解度を評価するために使用されるタスクであり、自然な画像を理解することとは根本的に異なります。 CQAでは、一般的な質問に答えたり、数値を推測したりするために、グラフのテキストコンポーネントとビジュアルコンポーネントの関係を分析する必要があります。ほとんどの既存のCQAデータセットとそのモデルは、人間のパフォーマンスを超えることを可能にすることが多い単純化された仮定に基づいています。この作業では、この結果の背後にある理由をさらに調査し、分類と回帰を共同で学習する新しいモデルを提案します。共注意トランスフォーマーを使用して設定された言語ビジョンは、質問とテキスト要素の間の複雑な相互作用をキャプチャします。これは、実際のチャートに一般的に存在します。現実的なPlotQAデータセットでの広範な実験と内訳を使用してこれらの結論を検証し、FigureQAで競争力のあるパフォーマンスを示しながら、以前のアプローチを大幅に上回っています。私たちのモデルのエッジは、語彙外の回答を伴う質問で特に強調されており、その多くは回帰を必要とします。この作業が、チャート理解の挑戦的で非常に実用的なタスクを解決するためのさらなる研究を刺激することを願っています。
Charts are a popular and effective form of data visualization. Chart question answering (CQA) is a task used for assessing chart comprehension, which is fundamentally different from understanding natural images. CQA requires analyzing the relationships between the textual and the visual components of a chart, in order to answer general questions or infer numerical values. Most existing CQA datasets and it models are based on simplifying assumptions that often enable surpassing human performance. In this work, we further explore the reasons behind this outcome and propose a new model that jointly learns classification and regression. Our language-vision set up with co-attention transformers captures the complex interactions between the question and the textual elements, which commonly exist in real-world charts. We validate these conclusions with extensive experiments and breakdowns on the realistic PlotQA dataset, outperforming previous approaches by a large margin, while showing competitive performance on FigureQA. Our model's edge is particularly emphasized on questions with out-of-vocabulary answers, many of which require regression. We hope that this work will stimulate further research towards solving the challenging and highly practical task of chart comprehension.
updated: Mon Nov 29 2021 18:46:06 GMT+0000 (UTC)
published: Mon Nov 29 2021 18:46:06 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト