多様体学習問題では、滑らかな低次元表面、すなわち、表面上の測定されたサンプル点のセットに基づいて、より高次元の線形ベクトル空間に埋め込まれた多様体を発見しようとします。この論文では、多様体の固有の次元とサンプル点の固有のエントロピーを推定する密接に関連した問題を検討します。具体的には、未知の滑らかな多様体でサポートされる未知の多変量密度の実現としてサンプルポイントを表示します。多様体次元の漸近的に一貫した推定値と多様体上のサンプル密度のRényiαエントロピーを得るために、測地線最小スパニングツリー(GMST)と呼ばれる新しい幾何学的確率アプローチを提示します。 GMSTアプローチは、その単純さで際立っており、多様体の再構成やサンプルの多変量密度の推定を必要としません。 GMSTメソッドは、測地線エッジマトリックスを使用して最小スパニングツリー(MST)シーケンスを構築し、MSTの全長を使用して多様体の次元とエントロピーを同時に推定します。人間の顔データセットの次元とエントロピー推定のためのGMSTアプローチを示します。
In the manifold learning problem one seeks to discover a smooth low dimensional surface, i.e., a manifold embedded in a higher dimensional linear vector space, based on a set of measured sample points on the surface. In this paper we consider the closely related problem of estimating the manifold's intrinsic dimension and the intrinsic entropy of the sample points. Specifically, we view the sample points as realizations of an unknown multivariate density supported on an unknown smooth manifold. We present a novel geometrical probability approach, called the geodesic-minimal-spanning-tree (GMST), to obtaining asymptotically consistent estimates of the manifold dimension and the Rényi α-entropy of the sample density on the manifold. The GMST approach is striking in its simplicity and does not require reconstructing the manifold or estimating the multivariate density of the samples. The GMST method simply constructs a minimal spanning tree (MST) sequence using a geodesic edge matrix and uses the overall lengths of the MSTs to simultaneously estimate manifold dimension and entropy. We illustrate the GMST approach for dimension and entropy estimation of a human face dataset.