arXiv reaDer
ほぼ線形時間での階層的凝集グラフクラスタリング
Hierarchical Agglomerative Graph Clustering in Nearly-Linear Time
エッジ加重グラフで広く使用されている階層的凝集クラスタリング(HAC)アルゴリズムを研究します。階層的凝集グラフクラスタリングのアルゴリズムフレームワークを定義します。これは、完全リンケージやWPGMAリンケージなどの従来のリンケージメジャー、およびその他のメジャーに対して、最初の効率的なO(m)時間正確アルゴリズムを提供します。さらに、おそらくHACの最も人気のあるバリアントである平均リンケージについては、O(nm)時間で実行されるアルゴリズムを提供します。このバリアントの場合、これは、定数ϵ> 0に対してm = n ^ 2-ϵである限り、準二次時間で実行される最初の正確なアルゴリズムです。この結果を、次の平均リンケージの単純なϵ近似近似アルゴリズムで補完します。 O(m)時間で実行されるフレームワーク。アルゴリズムのアプリケーションとして、最初にk-NNを使用してポイントセットからグラフを生成し、次に結果の重み付きグラフでアルゴリズムを実行することにより、距離空間でポイントをクラスタリングすることを検討します。公開されているデータセットでのアルゴリズムのパフォーマンスを検証し、このアプローチにより、ポイントデータセットのクラスタリングを20.7〜76.5倍高速化できることを示します。
We study the widely used hierarchical agglomerative clustering (HAC) algorithm on edge-weighted graphs. We define an algorithmic framework for hierarchical agglomerative graph clustering that provides the first efficient O(m) time exact algorithms for classic linkage measures, such as complete- and WPGMA-linkage, as well as other measures. Furthermore, for average-linkage, arguably the most popular variant of HAC, we provide an algorithm that runs in O(nm) time. For this variant, this is the first exact algorithm that runs in subquadratic time, as long as m=n^2-ϵ for some constant ϵ> 0. We complement this result with a simple ϵ-close approximation algorithm for average-linkage in our framework that runs in O(m) time. As an application of our algorithms, we consider clustering points in a metric space by first using k-NN to generate a graph from the point set, and then running our algorithms on the resulting weighted graph. We validate the performance of our algorithms on publicly available datasets, and show that our approach can speed up clustering of point datasets by a factor of 20.7--76.5x.
updated: Thu Jun 10 2021 09:29:05 GMT+0000 (UTC)
published: Thu Jun 10 2021 09:29:05 GMT+0000 (UTC)
参考文献 (このサイトで利用可能なもの) / References (only if available on this site)
被参照文献 (このサイトで利用可能なものを新しい順に) / Citations (only if available on this site, in order of most recent)
Amazon.co.jpアソシエイト