多様体学習は、コンピューターサイエンスの分野における最新の研究トピックであり、現実の世界で多くの用途があります。ただし、多様体学習法の主な欠点は、入力データ多様体から出力埋め込みへの明示的なマッピングがないことです。これにより、分類やターゲット検出など、多くの実際的な問題で多様体学習法を適用することは禁止されています。以前は、多様体学習法の明示的なマッピングを提供するために、高次元データサンプルとそれらの低次元埋め込みの間に線形投影が存在するという仮定で、近似明示表現マッピングを取得する多くの方法が提案されてきました。ただし、この直線性の仮定は制限が厳しすぎる場合があります。この論文では、高次元データサンプルとそれらの低次元表現の間に多項式マッピングが存在するという仮定に基づいて、多様体学習のための明示的な非線形マッピングを提案します。私たちが知る限り、多様体学習のための明示的な非線形マッピングが与えられるのはこれが初めてです。特に、これを局所線形埋め込み(LLE)の方法に適用し、近傍保存多項式埋め込み(NPPE)という名前の明示的な非線形多様体学習アルゴリズムを導出します。合成データと実世界データの両方の実験結果は、提案されたマッピングが、以前の研究よりも、高次元データサンプルの局所近傍情報と非線形ジオメトリを保存するのにはるかに効果的であることを示しています。
Manifold learning is a hot research topic in the field of computer science and has many applications in the real world. A main drawback of manifold learning methods is, however, that there is no explicit mappings from the input data manifold to the output embedding. This prohibits the application of manifold learning methods in many practical problems such as classification and target detection. Previously, in order to provide explicit mappings for manifold learning methods, many methods have been proposed to get an approximate explicit representation mapping with the assumption that there exists a linear projection between the high-dimensional data samples and their low-dimensional embedding. However, this linearity assumption may be too restrictive. In this paper, an explicit nonlinear mapping is proposed for manifold learning, based on the assumption that there exists a polynomial mapping between the high-dimensional data samples and their low-dimensional representations. As far as we know, this is the first time that an explicit nonlinear mapping for manifold learning is given. In particular, we apply this to the method of Locally Linear Embedding (LLE) and derive an explicit nonlinear manifold learning algorithm, named Neighborhood Preserving Polynomial Embedding (NPPE). Experimental results on both synthetic and real-world data show that the proposed mapping is much more effective in preserving the local neighborhood information and the nonlinear geometry of the high-dimensional data samples than previous work.