既存の教師なしハッシュ法は、通常、機能の類似性を維持するパラダイムを採用しています。その結果、彼らは連続特徴と離散ハッシュコード空間の間の本質的な類似性容量の不一致を見落としています。具体的には、特徴の類似度分布は本質的に偏っているため (たとえば、負のペアで中程度の正の類似度スコア)、正と負のペアのハッシュ コードの類似度は分離できなくなることがよくあります (つまり、類似度崩壊問題)。この問題を解決するために、この論文では、新しい類似性分布キャリブレーション (SDC) メソッドが導入されています。個々のペアワイズ類似度スコアを照合する代わりに、SDC はハッシュ コード類似度分布をキャリブレーション分布 (たとえば、ベータ分布) に合わせて、類似度容量/範囲全体に十分な広がりを持たせ、類似度崩壊の問題を軽減します。広範な実験により、当社の SDC は、大まかなカテゴリ レベルとインスタンス レベルの画像検索タスクの両方で、多くの場合大きな差で最先端の代替手段よりも優れていることが示されています。コードは https://github.com/kamwoh/sdc で入手できます。
Existing unsupervised hashing methods typically adopt a feature similarity preservation paradigm. As a result, they overlook the intrinsic similarity capacity discrepancy between the continuous feature and discrete hash code spaces. Specifically, since the feature similarity distribution is intrinsically biased (e.g., moderately positive similarity scores on negative pairs), the hash code similarities of positive and negative pairs often become inseparable (i.e., the similarity collapse problem). To solve this problem, in this paper a novel Similarity Distribution Calibration (SDC) method is introduced. Instead of matching individual pairwise similarity scores, SDC aligns the hash code similarity distribution towards a calibration distribution (e.g., beta distribution) with sufficient spread across the entire similarity capacity/range, to alleviate the similarity collapse problem. Extensive experiments show that our SDC outperforms the state-of-the-art alternatives on both coarse category-level and instance-level image retrieval tasks, often by a large margin. Code is available at https://github.com/kamwoh/sdc.