グラフに動機付けられた学習では、ラベルの伝播は、接続されたデータポイント間のエッジとして表されるデータの親和性に大きく依存します。アフィニティの割り当ては、マニフォールド上のデータの均等な分散を暗黙的に想定しています。この仮定は成り立たず、高密度領域へのドリフトのために不正確なメトリック割り当てにつながる可能性があります。グローバルに固定されたParzenウィンドウとのドリフトの影響を受けた熱核ベースの親和性は、本物のネイバーを破棄するか、離れたデータポイントをネイバーのメンバーにするように強制します。これにより、偏った親和性マトリックスが生成されます。この論文では、リーマン多様体での不均一なデータサンプリングによるバイアスは、近傍サイズ、周囲寸法、平坦度範囲などの関数として決定される可変パルゼンウィンドウによって提供されます。さらに、親和性調整が使用され、バイアスの原因となる不均一なサンプリング。正確なラベル伝播をもたらすために不規則なサンプリング効果を考慮に入れる親和性メトリックが提案されます。合成データセットと実世界のデータセットに関する広範な実験により、提案された方法が分類精度を大幅に向上させ、グラフラプラシアン多様体正規化法の既存のParzenウィンドウ推定量よりも優れていることが確認されました。
In graph motivated learning, label propagation largely depends on data affinity represented as edges between connected data points. The affinity assignment implicitly assumes even distribution of data on the manifold. This assumption may not hold and may lead to inaccurate metric assignment due to drift towards high-density regions. The drift affected heat kernel based affinity with a globally fixed Parzen window either discards genuine neighbors or forces distant data points to become a member of the neighborhood. This yields a biased affinity matrix. In this paper, the bias due to uneven data sampling on the Riemannian manifold is catered to by a variable Parzen window determined as a function of neighborhood size, ambient dimension, flatness range, etc. Additionally, affinity adjustment is used which offsets the effect of uneven sampling responsible for the bias. An affinity metric which takes into consideration the irregular sampling effect to yield accurate label propagation is proposed. Extensive experiments on synthetic and real-world data sets confirm that the proposed method increases the classification accuracy significantly and outperforms existing Parzen window estimators in graph Laplacian manifold regularization methods.