視覚データの構造記述子のファミリー、すなわち、非線形対称正定値(SPD)多様体、特殊なリーマン多様体にある共分散記述子(CovDs)を考えます。従来のCovDをユークリッド空間からSPD多様体に拡張することにより、画像セットコーディング用のCovDの改良版を提案します。具体的には、SPD行列の多様体は、対数ユークリッドフレームワークで定義された対数乗算とスカラー対数乗算の演算を備えた完全な内積空間です。このフレームワークでは、Mercerの条件を満足するアークコサインカーネルの観点から共分散構造を特徴付け、SPD行列の平均集中化の操作を提案します。さらに、監視された方法でカーネルアライメントによって学習された混合パラメーターを使用して、異なる次数のアークコサインカーネルを組み合わせます。提案されたフレームワークは、画像セット分類のタスクのために、より低次元でより識別的なデータ表現を提供します。実験結果は、最先端の方法と比較して、認識精度の観点から測定したその優れた性能を実証しています。
We consider a family of structural descriptors for visual data, namely covariance descriptors (CovDs) that lie on a non-linear symmetric positive definite (SPD) manifold, a special type of Riemannian manifolds. We propose an improved version of CovDs for image set coding by extending the traditional CovDs from Euclidean space to the SPD manifold. Specifically, the manifold of SPD matrices is a complete inner product space with the operations of logarithmic multiplication and scalar logarithmic multiplication defined in the Log-Euclidean framework. In this framework, we characterise covariance structure in terms of the arc-cosine kernel which satisfies Mercer's condition and propose the operation of mean centralization on SPD matrices. Furthermore, we combine arc-cosine kernels of different orders using mixing parameters learnt by kernel alignment in a supervised manner. Our proposed framework provides a lower-dimensional and more discriminative data representation for the task of image set classification. The experimental results demonstrate its superior performance, measured in terms of recognition accuracy, as compared with the state-of-the-art methods.