視覚化出版物の画像には、新しい視覚化デザインや視覚化の一般的な組み合わせなど、豊富な情報が含まれています。これらの画像の体系的なコレクションは、文献分析や視覚化のための自動化されたタスクなど、多くの側面でコミュニティに貢献することができます。この論文では、データセットVisImagesを作成して公開します。このデータセットは、IEEEInfoVisおよびVASTの1,397の論文からキャプション付きの12,267の画像を収集します。出版物の視覚化のための洗練された分類法に基づいて、データセットには35,096の注釈付き視覚化とその位置が含まれています。 VisImagesの有用性を、1)VisImages Explorerを使用した視覚化の進化の調査と分析、2)視覚化分類のためのトレーニングとベンチマークモデル、3)画像内の視覚化のローカライズと認識の3つのユースケースを通じて示します。
Images in visualization publications contain rich information, e.g., novel visualization designs and common combinations of visualizations. A systematic collection of these images can contribute to the community in many aspects, such as literature analysis and automated tasks for visualization. In this paper, we build and make public a dataset, VisImages, which collects 12,267 images with captions from 1,397 papers in IEEE InfoVis and VAST. Based on a refined taxonomy for visualizations in publications, the dataset includes 35,096 annotated visualizations, as well as their positions. We demonstrate the usefulness of VisImages through three use cases: 1) exploring and analyzing the evolution of visualizations with VisImages Explorer, 2) training and benchmarking models for visualization classification, and 3) localizing and recognizing visualizations in the images automatically.