ビジュアライゼーションの出版物の画像には、新しいビジュアライゼーションデザインやビジュアライゼーションの暗黙的なデザインパターンなどの豊富な情報が含まれています。これらの画像の体系的なコレクションは、文献分析や視覚化のための自動化されたタスクなど、多くの側面でコミュニティに貢献できます。この論文では、データセットVisImagesを作成して公開します。このデータセットは、IEEEInfoVisおよびVASTの1,397の論文からキャプション付きの12,267の画像を収集します。包括的な視覚化分類に基づいて構築されたデータセットには、35,096の視覚化とその境界ボックスが画像に含まれています.1)VisImages Explorerを使用した出版物での視覚化の使用の調査、2)トレーニングとベンチマークにより、VisImagesの有用性を示します。視覚化分類のモデル、および3)視覚分析システムで視覚化を自動的にローカライズします。
Images in visualization publications contain rich information, e.g., novel visualization designs and implicit design patterns of visualizations. A systematic collection of these images can contribute to the community in many aspects, such as literature analysis and automated tasks for visualization. In this paper, we build and make public a dataset, VisImages, which collects 12,267 images with captions from 1,397 papers in IEEE InfoVis and VAST. Built upon a comprehensive visualization taxonomy, the dataset includes 35,096 visualizations and their bounding boxes in the images.We demonstrate the usefulness of VisImages through three use cases: 1) investigating the use of visualizations in the publications with VisImages Explorer, 2) training and benchmarking models for visualization classification, and 3) localizing visualizations in the visual analytics systems automatically.