基礎となるグラフ構造を明らかにし、人間の注釈なしでノードを異なるクラスターに分割することを目的としたディープグラフクラスタリングは、基本的でありながら困難な作業です。ただし、既存のメソッドは表現の崩壊の問題に悩まされており、異なるクラスのサンプルを同じ潜在埋め込みに簡単にエンコードする傾向があることがわかりました。その結果、ノードの識別機能が制限され、クラスタリングのパフォーマンスが最適化されなくなります。この問題に対処するために、サンプルの識別能力を改善することにより、改善された二重相関低減ネットワーク(IDCRN)と呼ばれる新しいディープグラフクラスタリングアルゴリズムを提案します。具体的には、クロスビュー特徴相関行列を単位行列に近似することにより、特徴の異なる次元間の冗長性を減らし、潜在空間の識別能力を明示的に向上させます。一方、クロスビューサンプル相関行列は、設計されたクラスタリングで洗練された隣接行列を近似して、学習した潜在表現をガイドし、ビュー間でも親和性行列を回復するように強制されます。これにより、特徴の識別能力が暗黙的に強化されます。さらに、導入された伝搬正則化項により、グラフ畳み込みネットワーク(GCN)の過度の平滑化の問題によって引き起こされる表現の崩壊を回避し、IDCRNが浅いネットワーク構造で長距離情報をキャプチャできるようにします。 6つのベンチマークに関する広範な実験結果により、既存の最先端のディープグラフクラスタリングアルゴリズムと比較したIDCRNの有効性と効率が実証されています。
Deep graph clustering, which aims to reveal the underlying graph structure and divide the nodes into different clusters without human annotations, is a fundamental yet challenging task. However, we observed that the existing methods suffer from the representation collapse problem and easily tend to encode samples with different classes into the same latent embedding. Consequently, the discriminative capability of nodes is limited, resulting in sub-optimal clustering performance. To address this problem, we propose a novel deep graph clustering algorithm termed Improved Dual Correlation Reduction Network (IDCRN) through improving the discriminative capability of samples. Specifically, by approximating the cross-view feature correlation matrix to an identity matrix, we reduce the redundancy between different dimensions of features, thus improving the discriminative capability of the latent space explicitly. Meanwhile, the cross-view sample correlation matrix is forced to approximate the designed clustering-refined adjacency matrix to guide the learned latent representation to recover the affinity matrix even across views, thus enhancing the discriminative capability of features implicitly. Moreover, we avoid the collapsed representation caused by the over-smoothing issue in Graph Convolutional Networks (GCNs) through an introduced propagation regularization term, enabling IDCRN to capture the long-range information with the shallow network structure. Extensive experimental results on six benchmarks have demonstrated the effectiveness and the efficiency of IDCRN compared to the existing state-of-the-art deep graph clustering algorithms.