ディープハッシュは、大規模な画像検索で有望なパフォーマンスを示しています。ただし、Deep Neural Networks(DNN)によって抽出された潜在コードは、2値化プロセス中に必然的にセマンティック情報を失い、検索の精度が低下し、困難になります。多くの既存のアプローチは、量子化エラーを軽減するために正則化を実行しますが、メトリック学習と量子化学習の間の互換性のない競合を把握しています。メトリックの損失は、クラス間の距離にペナルティを課し、制約のないさまざまなクラスを遠くに押し出します。さらに悪いことに、潜在コードを理想的な2値化ポイントから逸脱してマッピングし、2値化プロセスで深刻なあいまいさを生成する傾向があります。バイナリ線形コードの最小距離に基づいて、このような競合を回避するために、ハッシュガイド付きヒンジ関数(HHF)を創造的に提案します。詳細には、ハッシュビット長とカテゴリ番号に依存する慎重に設計された変曲点が、メトリック項と量子化項のバランスをとるために明示的に採用されています。このような変更により、ネットワークがディープハッシュでローカルメトリックの最適な最小値に陥ることを防ぎます。 CIFAR-10、CIFAR-100、ImageNet、およびMS-COCOでの広範な実験は、HHFが一貫して既存の技術を上回り、他の方法に移植するために堅牢で柔軟性があることを示しています。コードはhttps://github.com/JerryXu0129/HHFで入手できます。
Deep hashing has shown promising performance in large-scale image retrieval. However, latent codes extracted by Deep Neural Networks (DNNs) will inevitably lose semantic information during the binarization process, which damages the retrieval accuracy and makes it challenging. Although many existing approaches perform regularization to alleviate quantization errors, we figure out an incompatible conflict between metric learning and quantization learning. The metric loss penalizes the inter-class distances to push different classes unconstrained far away. Worse still, it tends to map the latent code deviate from ideal binarization point and generate severe ambiguity in the binarization process. Based on the minimum distance of the binary linear code, we creatively propose Hashing-guided Hinge Function (HHF) to avoid such conflict. In detail, the carefully-designed inflection point, which relies on the hash bit length and category numbers, is explicitly adopted to balance the metric term and quantization term. Such a modification prevents the network from falling into local metric optimal minima in deep hashing. Extensive experiments in CIFAR-10, CIFAR-100, ImageNet, and MS-COCO show that HHF consistently outperforms existing techniques, and is robust and flexible to transplant into other methods. Code is available at https://github.com/JerryXu0129/HHF.