ディープハッシュモデルには通常、2つの主要な学習目的があります。学習したバイナリハッシュコードを識別可能にすることと、量子化誤差を最小限に抑えることです。ビットバランスやコードの直交性などのさらなる制約があるため、既存のモデルが多数(> 4)の損失を使用することは珍しくありません。これにより、モデルトレーニングが困難になり、その後、モデルの有効性が妨げられます。この作業では、単一の学習目的のみを持つ新しいディープハッシュモデルを提案します。具体的には、連続コードとそれに対応するバイナリ直交コード間の余弦類似度を最大化することで、ハッシュコードの識別性と量子化誤差の最小化の両方を保証できることを示します。さらに、この学習目標を使用すると、バッチ正規化(BN)レイヤーを使用するだけでコードのバランスをとることができ、ラベルの平滑化によりマルチラベル分類も簡単になります。その結果、さまざまな損失の重みを調整する煩わしさをすべて取り除く、1損失のディープハッシュモデルが得られます。重要なのは、大規模な実験により、私たちのモデルが非常に効果的であり、3つの大規模なインスタンス取得ベンチマークで最先端のマルチロスハッシュモデルを大幅に上回っていることを示しています。コードはhttps://github.com/kamwoh/orthohashで入手できます
A deep hashing model typically has two main learning objectives: to make the learned binary hash codes discriminative and to minimize a quantization error. With further constraints such as bit balance and code orthogonality, it is not uncommon for existing models to employ a large number (>4) of losses. This leads to difficulties in model training and subsequently impedes their effectiveness. In this work, we propose a novel deep hashing model with only a single learning objective. Specifically, we show that maximizing the cosine similarity between the continuous codes and their corresponding binary orthogonal codes can ensure both hash code discriminativeness and quantization error minimization. Further, with this learning objective, code balancing can be achieved by simply using a Batch Normalization (BN) layer and multi-label classification is also straightforward with label smoothing. The result is an one-loss deep hashing model that removes all the hassles of tuning the weights of various losses. Importantly, extensive experiments show that our model is highly effective, outperforming the state-of-the-art multi-loss hashing models on three large-scale instance retrieval benchmarks, often by significant margins. Code is available at https://github.com/kamwoh/orthohash