複雑な非線形データ構造のため、リーマン多様体の次元削減は困難です。従来の主成分分析(PCA)を多様体に一般化するために、確率的主測地線解析(PPGA)が提案されていますが、その有効性は単一のモダリティを持つデータに限定されています。この論文では、複数のPGAモデルを最尤フレームワークに統合するユニークな方法を提供する新しいガウス潜在変数モデルを提示します。これにより、部分母集団の確率的主測地線解析(MPPGA)の明確に定義された混合モデルが得られます。主部分空間のパラメーターは、期待値最大化アルゴリズムを使用して自動的に推定されます。さらに、無関係な主測地線を抑制することでデータの次元を自動的に削減する混合ベイジアンPGA(MBPGA)モデルを開発します。合成球データ、実際の脳梁、および人間の脳磁気共鳴(MR)およびCT画像からの下顎骨データを使用して、クラスタリングおよび統計的形状分析のコンテキストでモデルの利点を示します。
Dimensionality reduction on Riemannian manifolds is challenging due to the complex nonlinear data structures. While probabilistic principal geodesic analysis~(PPGA) has been proposed to generalize conventional principal component analysis (PCA) onto manifolds, its effectiveness is limited to data with a single modality. In this paper, we present a novel Gaussian latent variable model that provides a unique way to integrate multiple PGA models into a maximum-likelihood framework. This leads to a well-defined mixture model of probabilistic principal geodesic analysis (MPPGA) on sub-populations, where parameters of the principal subspaces are automatically estimated by employing an Expectation Maximization algorithm. We further develop a mixture Bayesian PGA (MBPGA) model that automatically reduces data dimensionality by suppressing irrelevant principal geodesics. We demonstrate the advantages of our model in the contexts of clustering and statistical shape analysis, using synthetic sphere data, real corpus callosum, and mandible data from human brain magnetic resonance~(MR) and CT images.