異種データ間の測定は未解決の問題です。さまざまなモダリティ間の類似性を直接計算できる共通の部分空間を学習するために、多くの研究が開発されてきました。ただし、既存の作品のほとんどは潜在部分空間の学習に焦点を当てていますが、意味的に構造的な情報はあまり保存されていません。したがって、これらのアプローチでは望ましい結果を得ることができません。この論文では、この問題を2つの側面で解決するために、カーネル相関最大化と識別構造保存(CKD)を介したクロスモーダル部分空間学習と呼ばれる新しいフレームワークを提案します。まず、各モダリティデータが意味的に隣接関係を保持するように、共有セマンティックグラフを構築します。次に、サンプルの特徴類似性とセマンティック類似性の間の一貫性を確保するために、ヒルベルト・シュミット独立基準(HSIC)を導入します。我々のモデルは、カーネル相関を最大化することにより、モダリティ間の相関を考慮するだけでなく、各モダリティ内の意味的に構造的な情報も保存します。 3つの公開データセットで提案されているフレームワークを評価するために、広範な実験が行われています。実験結果は、提案されたCKDが古典的な部分空間学習法と比較して競争力があることを示しました。
The measure between heterogeneous data is still an open problem. Many research works have been developed to learn a common subspace where the similarity between different modalities can be calculated directly. However, most of existing works focus on learning a latent subspace but the semantically structural information is not well preserved. Thus, these approaches cannot get desired results. In this paper, we propose a novel framework, termed Cross-modal subspace learning via Kernel correlation maximization and Discriminative structure-preserving (CKD), to solve this problem in two aspects. Firstly, we construct a shared semantic graph to make each modality data preserve the neighbor relationship semantically. Secondly, we introduce the Hilbert-Schmidt Independence Criteria (HSIC) to ensure the consistency between feature-similarity and semantic-similarity of samples. Our model not only considers the inter-modality correlation by maximizing the kernel correlation but also preserves the semantically structural information within each modality. The extensive experiments are performed to evaluate the proposed framework on the three public datasets. The experimental results demonstrated that the proposed CKD is competitive compared with the classic subspace learning methods.