arXiv reaDer
多次元射影のクラスター間信頼性の測定と説明
Measuring and Explaining the Inter-Cluster Reliability of Multidimensional Projections
多次元投影(MDP)のクラスター間信頼性、具体的には元の高次元空間と低次元投影空間の間でクラスター間構造がどの程度維持されているかを測定する2つの新しいメトリックである安定性と凝集性を提案します。クラスター間の信頼性を測定することは、クラスター間のタスク(たとえば、投影されたビューから元の空間でのクラスターの関係を特定する)をどれだけうまく実行できるかに直接影響するため、非常に重要です。ただし、クラスター間タスクの重要性にもかかわらず、信頼性や継続性などの以前のメトリックでは、クラスター間の信頼性を測定できないことがわかりました。私たちのメトリックは、クラスター間の信頼性の2つの側面を考慮します。安定性は、投影された空間のクラスターが元の空間のクラスターを形成する程度を測定し、凝集性はその逆を測定します。それらは、一方の空間で任意の形状と位置を持つランダムなクラスターを抽出し、クラスターがもう一方の空間でどれだけ引き伸ばされているか、または分散しているかを評価します。さらに、私たちのメトリックは、ポイントごとの歪みを定量化できるため、信頼性マップと呼ばれる、投影におけるクラスター間の信頼性の視覚化が可能になります。定量的な実験を通じて、以前のメトリックでは歪みをキャプチャするのが困難であるのに対し、メトリックがクラスター間の信頼性を損なう歪みを正確にキャプチャすることを確認します。ケーススタディは、メトリックと信頼性マップが1)ユーザーが適切な投影手法またはハイパーパラメーターを選択するのをサポートし、2)クラスター間タスクの実行中に誤解を防ぎ、クラスター間構造の適切な識別を可能にすることも示しています。
We propose Steadiness and Cohesiveness, two novel metrics to measure the inter-cluster reliability of multidimensional projection (MDP), specifically how well the inter-cluster structures are preserved between the original high-dimensional space and the low-dimensional projection space. Measuring inter-cluster reliability is crucial as it directly affects how well inter-cluster tasks (e.g., identifying cluster relationships in the original space from a projected view) can be conducted; however, despite the importance of inter-cluster tasks, we found that previous metrics, such as Trustworthiness and Continuity, fail to measure inter-cluster reliability. Our metrics consider two aspects of the inter-cluster reliability: Steadiness measures the extent to which clusters in the projected space form clusters in the original space, and Cohesiveness measures the opposite. They extract random clusters with arbitrary shapes and positions in one space and evaluate how much the clusters are stretched or dispersed in the other space. Furthermore, our metrics can quantify pointwise distortions, allowing for the visualization of inter-cluster reliability in a projection, which we call a reliability map. Through quantitative experiments, we verify that our metrics precisely capture the distortions that harm inter-cluster reliability while previous metrics have difficulty capturing the distortions. A case study also demonstrates that our metrics and the reliability map 1) support users in selecting the proper projection techniques or hyperparameters and 2) prevent misinterpretation while performing inter-cluster tasks, thus allow an adequate identification of inter-cluster structure.
updated: Fri Jul 16 2021 12:52:13 GMT+0000 (UTC)
published: Fri Jul 16 2021 12:52:13 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト