arXiv reaDer
投影レイアウトの信頼性を向上させるための多点次元削減
Multi-point dimensionality reduction to improve projection layout reliability
通常の次元削減(DR)では、m次元空間(元の空間)の各データインスタンスは、d次元空間(視覚空間)の1つのポイントにマッピングされ、可能な限り距離や近隣の関係が保持されます。それらの人気にもかかわらず、単純なデータセットであっても、既存のDR手法は、誤解を招くような視覚的表現を生成することは避けられません。問題は既存の解決策ではなく、問題の定式化にあります。 2次元の視覚空間の場合、データインスタンスが同一平面上にないか、2D多様体上にない場合、問題の解決策はありません。可能な近似により、通常、距離の保存が不正確になり、近傍が重なるレイアウトになります。このホワイトペーパーでは、この問題を軽減するためのステップとして、各データインスタンスを視覚空間内の複数のポイントにマッピングできる、マルチポイント次元削減の概念について詳しく説明します。ポイントを複製することにより、背景情報が視覚表現に追加され、視覚空間内のローカル近隣が元の空間により忠実になります。 Red Grey Plusという名前の当社のソリューションは、通常のDRとグラフ描画技術の組み合わせに基づいて構築され、拡張されています。マルチポイント次元削減は、DRレイアウトの信頼性を向上させるための潜在的な方向性のひとつであるだけでなく、問題に対する最初の解決策が一般的な通常のDR手法よりも定量的に優れていることを示します。
In ordinary Dimensionality Reduction (DR), each data instance in an m-dimensional space (original space) is mapped to one point in a d-dimensional space (visual space), preserving as much as possible distances and/or neighborhood relationships. Despite their popularity, even for simple datasets, the existing DR techniques unavoidably may produce misleading visual representations. The problem is not with the existing solutions but with problem formulation. For two dimensional visual space, if data instances are not co-planar or do not lie on a 2D manifold, there is no solution for the problem, and the possible approximations usually result in layouts with inaccuracies in the distance preservation and overlapped neighborhoods. In this paper, we elaborate on the concept of Multi-point Dimensionality Reduction where each data instance can be mapped to possibly more than one point in the visual space by providing the first general solution to it as a step toward mitigating this issue. By duplicating points, background information is added to the visual representation making local neighborhoods in the visual space more faithful to the original space. Our solution, named Red Gray Plus, is built upon and extends a combination of ordinary DR and graph drawing techniques. We show that not only Multi-point Dimensionality Reduction can be one of the potential directions to improve DR layouts' reliability but also that our initial solution to the problem outperforms popular ordinary DR methods quantitatively.
updated: Wed Apr 07 2021 20:30:37 GMT+0000 (UTC)
published: Fri Jan 15 2021 17:17:02 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト