大規模なクロスモーダルハッシュの類似性検索は、検索エンジンや自動操縦などの最新の検索アプリケーションでますます注目を集めており、計算とストレージの優れた優位性を示しています。ただし、現在の教師なしクロスモーダルハッシュ手法には、まだいくつかの制限があります:(1)多くの手法は、離散制約を緩和して、検索パフォーマンスを大幅に低下させる可能性がある最適化目標を解決します;(2)ほとんどの既存のハッシュモデルは、異種データを共通の潜在データに投影しますヘテロジニアスデータの多様性を見失ってしまう可能性のある空間;(3)実数値のデータポイントをバイナリコードに変換すると、常に大量の情報が失われ、最適ではない連続した潜在空間が生成されます。上記の問題を克服するために、本論文では、新規のクラスタ単位の教師なしハッシュ(CUH)メソッドを提案します。具体的には、CUHは、異なるモダリティの元のデータポイントを独自の低次元の潜在的な意味空間に投影するマルチビュークラスタリングを共同で実行し、独自の低次元空間でクラスタの重心点と共通のクラスタリングインジケータを見つけて、コンパクトハッシュコードと対応する線形ハッシュ関数。ガイダンスのクラスターワイズコードプロトタイプの下で、モダリティ全体で統一されたバイナリコードを学習するために、離散最適化フレームワークが開発されています。 CUHの合理性と有効性は、多様なベンチマークデータセットに関する包括的な実験によって実証されています。
Large-scale cross-modal hashing similarity retrieval has attracted more and more attention in modern search applications such as search engines and autopilot, showing great superiority in computation and storage. However, current unsupervised cross-modal hashing methods still have some limitations: (1)many methods relax the discrete constraints to solve the optimization objective which may significantly degrade the retrieval performance;(2)most existing hashing model project heterogenous data into a common latent space, which may always lose sight of diversity in heterogenous data;(3)transforming real-valued data point to binary codes always results in abundant loss of information, producing the suboptimal continuous latent space. To overcome above problems, in this paper, a novel Cluster-wise Unsupervised Hashing (CUH) method is proposed. Specifically, CUH jointly performs the multi-view clustering that projects the original data points from different modalities into its own low-dimensional latent semantic space and finds the cluster centroid points and the common clustering indicators in its own low-dimensional space, and learns the compact hash codes and the corresponding linear hash functions. An discrete optimization framework is developed to learn the unified binary codes across modalities under the guidance cluster-wise code-prototypes. The reasonableness and effectiveness of CUH is well demonstrated by comprehensive experiments on diverse benchmark datasets.