arXiv reaDer
次元削減散布図レイアウトの重複を除去するためのグリッドベースの方法
A Grid-based Method for Removing Overlaps of Dimensionality Reduction Scatterplot Layouts
次元削減 (DR) 散布図レイアウトは、多次元データセットを分析するためのユビキタスな視覚化ツールになっています。その人気にもかかわらず、このような散布図はオクルージョンの影響を受け、特にデータ インスタンスを表すために有益なグリフが使用されている場合、実行中の分析にとって重要な情報が難読化される可能性があります。この問題に対処するために、興味深いデータ パターンを明らかにする現代の DR 技術の強力な機能に欠けるオーバーラップのないレイアウトを作成するか、後処理戦略としてオーバーラップを排除するなど、さまざまな戦略が考案されています。後処理技術の結果が良好であるにもかかわらず、最良の方法のほとんどは通常、散布図領域を拡大または歪め、その結果、グリフのサイズが (場合によっては) 判読不能なサイズに縮小され、重複を除去する目的が無効になります。このペーパーでは、元のレイアウトの特性を忠実に保持し、最小グリフ サイズを制限する、DR レイアウトから重複を除去するための新しい後処理戦略である Distance Grid (DGrid) について説明します。 DGrid は、(複数の異なるメトリクスを考慮した広範な比較評価を通じて) 重複除去において最先端技術を上回っていると同時に、特に大規模なデータセットに対して最も高速な技術の 1 つであることを示します。 51 人の参加者を対象としたユーザー調査では、DGrid が元の散布図の視覚的特徴と最終結果の美しさを維持するための技術として常に上位にランクされていることも示しています。
Dimensionality Reduction (DR) scatterplot layouts have become a ubiquitous visualization tool for analyzing multidimensional datasets. Despite their popularity, such scatterplots suffer from occlusion, especially when informative glyphs are used to represent data instances, potentially obfuscating critical information for the analysis under execution. Different strategies have been devised to address this issue, either producing overlap-free layouts which lack the powerful capabilities of contemporary DR techniques in uncovering interesting data patterns or eliminating overlaps as a post-processing strategy. Despite the good results of post-processing techniques, most of the best methods typically expand or distort the scatterplot area, thus reducing glyphs' size (sometimes) to unreadable dimensions, defeating the purpose of removing overlaps. This paper presents Distance Grid (DGrid), a novel post-processing strategy to remove overlaps from DR layouts that faithfully preserves the original layout's characteristics and bounds the minimum glyph sizes. We show that DGrid surpasses the state-of-the-art in overlap removal (through an extensive comparative evaluation considering multiple different metrics) while also being one of the fastest techniques, especially for large datasets. A user study with 51 participants also shows that DGrid is consistently ranked among the top techniques for preserving the original scatterplots' visual characteristics and the aesthetics of the final results.
updated: Tue May 09 2023 01:58:21 GMT+0000 (UTC)
published: Fri Mar 08 2019 18:20:36 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト